MediaCrawler icon indicating copy to clipboard operation
MediaCrawler copied to clipboard

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫

Results 248 MediaCrawler issues
Sort by recently updated
recently updated
newest added

小红书评论如何能获取到评论的图片呀?

在安装完库和playwright后,在conda 使用python3 main.py --platform xhs --lt qrcode --type search他没报错也没有弹出其他窗口或者显示运行进度,这是为什么呢。。

对于某个视频的评论,可以抓取对于这个评论的回复评论吗?

enhancement

麻烦坐着看看,这个算法是不是有问题,对照了很多次,过不去

string uri = "/api/sns/web/v2/comment/sub/page"; Dictionary parameters = new Dictionary { { "note_id", noteId }, { "root_comment_id", rootCommentId }, { "num", num.ToString() }, { "cursor", cursor } }; 请求时sub/page,获取到没有报错,但是没有数据,不清楚是什么原因。 Responser Body:{"code":0,"success":true,"msg":"成功","data":{"user_id":"65beddf30000000016003613","comments":[],"has_more":false,"time":1707300933533}}

报错日志:(myvenv) D:\dev\project\graduationProject\craw\new\MediaCrawler>python main.py --platform dy --lt qrcode --type search 2024-02-08 17:29:50 MediaCrawler INFO [DouYinCrawler.search] Begin search douyin keywords 2024-02-08 17:29:50 MediaCrawler INFO [DouYinCrawler.search] Current keyword: python Traceback (most recent call...

当前程序,当登录成功后,playwright启动的窗口不能关闭掉,因为post和get时需要header,而header需要从playwright获取。 playwright启动的窗口占用很大内存,哪怕是headless模式, **我希望只在登录时使用playwright,爬取时可以关闭playwright的窗口,可以从哪里入手呢,能不能提供一些思路。** 且playwright在登录和爬取中解耦后,爬取的程序就可以跑在非Ubuntu上了

help wanted