MediaCrawler
MediaCrawler copied to clipboard
关于bilibili平台下,视频信息与评论信息字段的增加建议
- 现有的视频信息中,关于视频热度的字段包含:
点赞数:like、播放数:view、弹幕数:danmaku、评论数:reply,但通过爬取视频信息接口返回的json数据中,还包含与热度相关的字段如:点踩数:dislike、收藏数:favorite、分享数:share、硬币数:coin。 - 现有的评论信息中,关于评论用户信息的字段包含:
用户 id:mid、用户昵称:uname、用户头像链接:avatar,但通过爬取评论接口返回的json数据中,还包含与评论用户信息的字段如:用户性别:sex。、
希望该issue可以作为未来的功能增强的一个方向,虽然现有数据字段已有许多,但考虑到获取到的数据应用方向,提供以上字段可供于更广层面上的数据分析(如论文研究领域、企业数据分析中,提取用户画像,分析热度排行等方向的研究)
你的PR已合并到主干,感谢贡献~