alasai
alasai
因为上拉是获取旧数据,应该不存在有新数据,所以应该显示“没有更多数据” 第二个的意思是,有时打开页面他应该显示pagesize=1的数据,但是他有时会显示pagesize=2的数据
import sys sys.path.append(r"E:\scrape_news-master\scrape_news-master\utils")我写成这样就不报错了,但是 解析里面的neteasy.json就报错了,如果写成sys.path.insert 请问应该怎么写呢?我说的是相对路径
恩好的,非常感谢,我试下
对了,你这个应该缺少个任务调度框架吧,不然的每次的话都是通过命令行运行吧
我的意思是图形化界面管理任务,比如暂停,启动,爬取的频率设置等等,就像APScheduler这个,得结合flask,网上有这个flask_apscheduler这个,但是我这边是windows就没法测试了,你要是把这个做出来就更牛逼了,还有如果把这个爬虫做成分布式的,scrapy-redis
  你这个好像得需要建两张表,建过之后,运行起来报如下的错误: ERROR:loggers:error 1064: 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to...
恩我把mysql改成sqlserver存储了,还有一个问题请教你:你这里所有爬虫都是调用同一个pipeline然后保存到同一张表的是吧?如果我定义了不同的pipeline,怎么让不同的爬虫对应各自的pipeline呢?