WEB_KG icon indicating copy to clipboard operation
WEB_KG copied to clipboard

抽取百科别的内容

Open Garethyu opened this issue 2 years ago • 3 comments

您好,我成功运行了您的项目,这是一个非常棒的项目。

不过爬取的大多数内容都是人物,请问在什么地方进行修改能够爬取别的内容呢?

Garethyu avatar Apr 28 '22 14:04 Garethyu

我也有相同的问题 修改这一句#start_urls = ['https://baike.baidu.com/item/文汇报'] 好像没有用

adventurexw avatar Jul 21 '22 05:07 adventurexw

简单的做法,比如你要爬取花,那就以花开始爬,比如https://baike.baidu.com/item/荷花

lixiang0 avatar Jul 22 '22 07:07 lixiang0

简单的做法,比如你要爬取花,那就以花开始爬,比如https://baike.baidu.com/item/荷花

我是这样改的,但好像没有用,他好像是顺着上次爬虫的结果,接着往下爬取的。而且这个好像没有那个设置停止,就是不停的往下爬虫的样子。我也很奇怪。

adventurexw avatar Jul 22 '22 07:07 adventurexw