首页 1 2 3 4 5 6 7

perl去除字符串中的空格有问题

淘宝网页中有下面字符：

价　　格：

我最开始用perl试图去除中间的空格时用s/\s//g，发现根本没反应。

淘宝的这个空格不是我们想像中的空格！

后来我想是不是编码的问题，因为网页的编码是GBK，而perl默认处理的都是UTF-8，所以转了一下。

iconv -f GBK -t UTF-8 file1 -o file2

将Google香港的Big5编码转换成GBK编码

curl -s http://www.google.com.hk/ | iconv -f big5 -t gbk

依旧没反应。实际上perl在处理字符串时读入内存的时候已统一转换成了UTF-8编码，不需要我们劳神费心，只是把字符串处理完输出的时候又成乱码了。如果你需要输出就手动转换一下，在程序里可以用Encode::from_to或Unicode::MapUTF8::to_utf8，如果你不需要输出就不需要事先转换。

淘宝的这个空格和我们想像中的空格到底有什么区别？

我新建一个文件，把淘宝“价格”之间的那两个空格复制到第一行，查看文件的十六进制编码。

然后第二行自己输了两个空格，再次查看文件的十六进制编码。

淘宝的一个空格用e3 80 80来表示，我的一个空格用20来表示，0a应该代表换行。

那我如何把淘宝的空格去掉呢？直接把淘宝的空格复制到正则表达式中吧：

s/[　\f\t\r\n ]//g

springboot kafka 动态创建 topic 批量消费监听

文章目录问题分析

【Clickhouse】Cannot allocate block number in Zookeeper write prefix view location

（一）Kubernetes打造云原生Devops--Kubernetes集群搭建

（一）Kubernetes打造云原生Dev

ubuntu安装caffe2

1. 下载文件 conda install 报错： >>> from caffe2.python import core Traceback (most recent call las

花少笔记之HashMap解锁让你玩爆面试官

好久没有更新文章目录了，今天正好在家休息，就整理了下（绿色字体表示已经完成或者进行中，黑色字体表示规划中），大家有什么好的建议欢迎踊跃评论（下午要是来得及可能会分享一篇关于业务管理流程BPM系统的产品解决方案）：

晨哥Leetcode 873 最长斐波那契序列的长度 · Length of Longest Fibonacci Subsequence

A sequence X_1, X_2, …, X_n is fibonacci-like if: n >= 3 X_i + X_{i+1} = X_{i+2} for all i + 2 <= n Given a stri

笔记篇之微服务

spring cloud 介绍 spring cloud 是一系列框架的集合。它利用 spring boot 的开发便利性巧妙地简

【UE4的垃圾回收】

UE4的垃圾回收

linux服务器时间同步

Linux服务器时间同步需求：两台以上服务器之间的时间同步，以其中一台服务器为时间源，其余服务器同步这台时间源服务器的

【超多代码、超多图解】Node.js一文全解析