WEB_KG 抽取百科别的内容

抽取百科别的内容

Open Garethyu opened this issue 2 years ago • 3 comments

您好，我成功运行了您的项目，这是一个非常棒的项目。

不过爬取的大多数内容都是人物，请问在什么地方进行修改能够爬取别的内容呢？

Apr 28 '22 14:04 Garethyu

我也有相同的问题修改这一句#start_urls = ['https://baike.baidu.com/item/文汇报'] 好像没有用

Jul 21 '22 05:07 adventurexw

简单的做法，比如你要爬取花，那就以花开始爬，比如https://baike.baidu.com/item/荷花

Jul 22 '22 07:07 lixiang0

简单的做法，比如你要爬取花，那就以花开始爬，比如https://baike.baidu.com/item/荷花

我是这样改的，但好像没有用，他好像是顺着上次爬虫的结果，接着往下爬取的。而且这个好像没有那个设置停止，就是不停的往下爬虫的样子。我也很奇怪。

Jul 22 '22 07:07 adventurexw