WEB_KG
WEB_KG copied to clipboard
抽取百科别的内容
您好,我成功运行了您的项目,这是一个非常棒的项目。
不过爬取的大多数内容都是人物,请问在什么地方进行修改能够爬取别的内容呢?
我也有相同的问题 修改这一句#start_urls = ['https://baike.baidu.com/item/文汇报'] 好像没有用
简单的做法,比如你要爬取花,那就以花开始爬,比如https://baike.baidu.com/item/荷花
简单的做法,比如你要爬取花,那就以花开始爬,比如https://baike.baidu.com/item/荷花
我是这样改的,但好像没有用,他好像是顺着上次爬虫的结果,接着往下爬取的。而且这个好像没有那个设置停止,就是不停的往下爬虫的样子。我也很奇怪。