PHP去掉诡异的BOM \ufeff

说明:
在做项目时出现了一个诡异的问题,游戏客户端发送数据请求到服务端,php获取到客户端发送的请求后返回json格式的数据给客户端。但客户端一直显示获取不到数据。
1.查看php日志,发现php有接收客户端生成json数据,php正常
2.通过charles抓取客户端通信,可以看到客户端有正常发送请求、但php返回给客户端的数据(response)却是空的。
3.有怀疑是不是php文件保存的编码方式错误,导致生成的json有错误,但发现json数据都是英文、数字,并没有汉字
4.后来通过php模拟客户端请求,手动post数据到服务端,在浏览器开发工具下看到原来php返回给客户端的json数据前面出现了几个莫名其妙的小红点。因为json数据开头该红点的存在,客户端以为php返回的json数据是错误的。。。其实正确的json就在后面
bom

很明显就是这几个小红点惹的祸,剩下的就是排查为什么会有小红点了,开始以为这几个小红点应该是空格之类的字符,后来在调试中无意间把鼠标放到小红点上面发现居然有提示,提示内容为:\UFEFF。原来是这个字符惹的祸。后来发现这个原来是window编辑器为保存为utf8的文件自动加上BOM头,这样其它编辑器就会知道用utf8来显示字符。

附录:
附录一、bom头说明
类似WINDOWS自带的记事本等软件,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。对于一般的文件,这样并不会产生什么麻烦。
但对于PHP来说,BOM是个大麻烦。PHP并不会忽略BOM,所以在读取、包含或者引用这些文件时,会把BOM作为该文件开头正文的一部分。根据嵌入式语言的特点,这串字符将被直接执行(显示)出来。由此造成即使页面的 top padding 设置为0,也无法让整个网页紧贴浏览器顶部,因为在html一开头有这3个字符呢!
在网页上并不需要添加BOM头识别,因为网页上可以使用 head头 指定charset=utf8告诉浏览器用utf8来解释.但是你用window自动的编辑器,编辑,然后有显示在网页上这样就会显示出0xEF 0xBB 0xBF这3个字符。
这样网页上就需要去除0xEF 0xBB 0xBF,可以使用editplus 选择不带BOM的编码,这样就可以去除了

附录二、Linux下查找包含BOM头的文件和清除BOM头命令
查看包含bom头的文件
# grep -r -I -l $’^\xEF\xBB\xBF’ ./

清除包含bom头的文件
# find . -type f -exec sed -i ‘s/\xEF\xBB\xBF//’ {} \;

发表评论

邮箱地址不会被公开。 必填项已用*标注