于殿国

Results 3 comments of 于殿国

爬取tech.qq.com 所有的中文都会变成乱码,使用mb_detect_encoding方法查出实际编码EUC-CN;你可以试一试爬取http://tech.qq.com/网站,里面的中文都是乱码。

我现在就是用 mb_detect_encoding($this->_strContent, array("ASCII","UTF-8","GB2312","GBK"));这个检测了一下,返回的东西和白天试的不一样这会返回的编码是CP936。可能是他们网站做了什么处理了把。我看有人介绍说不建议使用这中方式检测编码,说是不准确