Douyin_TikTok_Download_API icon indicating copy to clipboard operation
Douyin_TikTok_Download_API copied to clipboard

可以有CLI 方案,get到特定帐号的所有视频基础数据么

Open nevertoday opened this issue 3 years ago • 15 comments

基础数据:发布时间,标题,url,点赞量,播放量,评论量,封面图地址...实际无水印地址...

nevertoday avatar Feb 13 '23 15:02 nevertoday

API已经可以抓取相关的数据了。

Evil0ctal avatar Feb 13 '23 20:02 Evil0ctal

如果你可以自己写一个CLI的话,欢迎PR到此项目中。

Evil0ctal avatar Feb 15 '23 22:02 Evil0ctal

好滴!

nevertoday avatar Feb 16 '23 02:02 nevertoday

你好,求教如何使用此项目获取上述基础数据,谢谢了!

Ppinnacle avatar Feb 19 '23 13:02 Ppinnacle

我现在在用chatGPT教我怎么对接,貌似思路很清楚~ 有接口, 接口就是银行柜台~。。。。

nevertoday avatar Feb 19 '23 14:02 nevertoday

使用这个包可以直接调用:https://pypi.org/project/douyin-tiktok-scraper/

import asyncio
from douyin_tiktok_scraper.scraper import Scraper

api = Scraper()

async def hybrid_parsing(url: str) -> dict:
    # Hybrid parsing(Douyin/TikTok URL)
    result = await api.hybrid_parsing(url)
    print(f"The hybrid parsing result:\n {result}")
    return result

asyncio.run(hybrid_parsing(url=input("Paste Douyin/TikTok share URL here: ")))

Evil0ctal avatar Feb 19 '23 20:02 Evil0ctal

我现在在用chatGPT教我怎么对接,貌似思路很清楚~ 有接口, 接口就是银行柜台~。。。。

我是小白- - 之前用大部分都是cli直接运行 作者的项目太高深看不懂ε=(´ο`*)))唉 想收集点赞评论数啥的

Ppinnacle avatar Feb 20 '23 07:02 Ppinnacle

如果不是python语言的话,你只需要将此项目部署在自己的服务器上,然后使用http get方法请求/api端点即可,本质上就是基于http的接口,你需要的数据会在返回的JSON数据中。

Evil0ctal avatar Feb 20 '23 07:02 Evil0ctal

我现在在用chatGPT教我怎么对接,貌似思路很清楚~ 有接口, 接口就是银行柜台~。。。。

调用接口可能涉及到逆向工程,你需要系统性的学习一下。

Evil0ctal avatar Feb 20 '23 07:02 Evil0ctal

受教 我需要再补补课了

Ppinnacle avatar Feb 20 '23 07:02 Ppinnacle

不客气,你可以在自述文档中找到获取数据的方式。

Evil0ctal avatar Feb 20 '23 07:02 Evil0ctal

@Evil0ctal 您好我想咨询下,API可以获取某个hashtag下面所有视频数据么,数据量大概是几万条,或者有没有API可以按照一个时间范围按照某个hashtag获得所有视频元数据,感谢

zhangzyg avatar Jul 25 '24 12:07 zhangzyg

@Evil0ctal 您好我想咨询下,API可以获取某个hashtag下面所有视频数据么,数据量大概是几万条,或者有没有API可以按照一个时间范围按照某个hashtag获得所有视频元数据,感谢

可以,但是没有办法按照时间范围进行过滤。只能全部爬取后,在本地进行数据筛选。

Evil0ctal avatar Jul 26 '24 19:07 Evil0ctal

@Evil0ctal 请问我想要hashtag ukraine数据我看官方上面统计的count有7.1M这样的话全部抓取在两天内有可能么

zhangzyg avatar Jul 28 '24 06:07 zhangzyg

7.1M/20=355K

每20次间隔5秒总耗时1775K s

你自己计算吧

Evil0ctal avatar Jul 28 '24 07:07 Evil0ctal