Chen Lei comments

Results 925 comments of


                                            Chen Lei

微博搜索内容不全

@hsm11233 这个和天没关系，因为最多50页左右，设置51，就可能最多获取50页，不在细分。程序默认就是按天爬取的，只不过可能异步执行了不同日期，如果想一天爬取完成再爬另一天，只是在settings.py里把日期一天一天的设置，即爬完一天，再设置另一天。

感谢建议。 1.程序是边运行边获取下一页的，不知道总量，无法获得进度； 2.这个建议很好，其实也可以为每个关键词建立文件夹，把得到的内容放到对应文件夹下，这样文件名就不用包含关键词了，更清晰，可以通过修改pipelines.py完成，目前我没有时间弄这些，您可以自己修改，文件包含了所有文件的操作，应该不难； 3.这个没有计划，因为很多网友默认配置就有可能被限制，可能是和获取的数量有关吧，不确定，所以不会添加这个特性，望理解。再次感谢您的建议。