MediaCrawler icon indicating copy to clipboard operation
MediaCrawler copied to clipboard

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫

Results 248 MediaCrawler issues
Sort by recently updated
recently updated
newest added

不知道在哪配置关键词 运行出错 ![2](https://github.com/NanmiCoder/MediaCrawler/assets/62429849/d5c66ae8-8b54-4c4e-abf8-b7b8098e43c8) ![1](https://github.com/NanmiCoder/MediaCrawler/assets/62429849/d1e3a578-bd82-447a-a93b-08d8d165c3a4)

如题,评论里面是不是没有字段指明对应的是哪个帖子,有没有办法解决呢?

【你需要参与】 ● 负责设计和开发网络爬虫系统,进行多平台的信息抓取和分析 ● 根据网页特性设计独特的爬虫策略和防屏蔽规则,不断优化提升数据抓取的效率和质量 ● 完成并管理数据的清洗、结构化、入库、统计分析等全流程 ● 能够独当一面的完成数据聚合项目解决方案的制定,并完成方案的沉淀,以便后续复用 ● 具有分布式爬取和运维经验,能够保证项目的正常运行,实时解决出现的问题,确保项目的平稳、高质量运行 【我们对你的要求】 ● 责任心较强,做事细致耐心(此项有一票否决权) ● 良好的沟通能力和团队领导力,能有效组织和引导团队完成任务 ● 根据需求制定爬取方案并执行,并有良好的代码习惯及汇报习惯,抽象能力强 ● 精通至少一个爬虫框架(如Scrapy)或有相关实现,熟悉多线程,分布式爬虫的设计和实现,能处理大规模数据获取和处理的技术挑战 ● 熟练掌握基于正则表达式、XPath、CSS等网页信息抽取技术 ● 熟悉了解HTML、CSS、JavaScript,熟练掌握JS逆向、断点调试、HOOK等技能 ● 熟悉常见的反爬机制,验证码识别 ● 掌握熟练至少一种SQL语言,了解数据库优化策略,设计过千万级的表结构为加分项 ● 熟悉Linux及Docker、K8S,有K8S集群使用经验为加分项...

如果有这个功能。我该如何配置?

希望添加docker部署支持