Reetsee.Xu

Results 11 comments of Reetsee.Xu

@jpfree 写数据库的例子可以参考这个:[https://github.com/fanfank/news-combinator/blob/master/reconstruction/crawler/crawler.php](https://github.com/fanfank/news-combinator/blob/master/reconstruction/crawler/crawler.php) 这个程序是我用来做新闻网站demo的程序,demo网站地址是这个:[http://news.reetsee.com/](http://news.reetsee.com/)

@WeihuaGu 多谢支持哈,不过好久没研究过PHP的包管理等相关的内容了,目前还是先交给大家自己整合

Hi guys, seems this question is not about llama-python-cpp wheel building error, but I did encounter that problem and finally fix the problem on Mac 2018 Sonoma 14.0 Intel Chip,...

哈喽 @xcorp1986 ,很感谢你为这个项目做了这些更与时俱进的改动! 但是目前 Phpfetcher 暂时仍然希望保留原本的代码结构,主要原因是我个人目前比较少去维护这个项目,相关的文档、demo等也要逐个进行新代码的适配。 在后续的PHP项目中(如果我会开发的话···),一定会采用更与时俱进的方式去完成

能举个使用例子不?因为所有的内容都可以自己获取dom后通过正则匹配取出来

@TongJiankang 你好!你说的这个目前是有想法的,例如用phantomjs等,但目前囿于我这边时间比较紧,可能短期内没法实现这个功能。 建议前期可以通过接口获取数据,然后自己将数据组织到对应的视图中。

应该是可行的,你是在爬取tech.qq.com的内容时碰到了乱码问题? 如果有一个具体的出错example我这边会更好修复一些。

@yudianguo 我这边detect的结果是FALSE,你试一下在源码的这一行: https://github.com/fanfank/phpfetcher/blob/master/Phpfetcher/Page/Default.php#L363 后面加上`var_dump(mb_detect_encoding($this->_strContent));`,看看得到的结果是什么?

是的,之前我也是尝试过用这种方法,效果不太好。后来是想着既然页面内有编码标识就直接用,如果实际编码和声明的不一致,那么就和规范不统一了。这里我怀疑是另外一些问题导致了乱码,我再看看