TiebaBackup
TiebaBackup copied to clipboard
一个用于备份百度贴吧帖子的python脚本
Bumps [pycares](https://github.com/saghul/pycares) from 3.0.0 to 4.2.0. Release notes Sourced from pycares's releases. 4.2.0 What's Changed dependency update to c-ares by @aviadhahami in saghul/pycares#170 New Contributors @aviadhahami made their first contribution...
Bumps [urllib3](https://github.com/urllib3/urllib3) from 1.25.3 to 1.26.5. Release notes Sourced from urllib3's releases. 1.26.5 :warning: IMPORTANT: urllib3 v2.0 will drop support for Python 2: Read more in the v2.0 Roadmap Fixed...
### 在之前有备份过的帖子再备份速度会变慢,特别时将近三千评论的帖子,楼层如此之高,从头开始备份太浪费资源和时间了 ### 可以检测(beautiful suop 或者正则表达式)自己楼层和最新楼层 再对这些楼层更新 再且百度贴吧就没有重新编辑这一说,以前的楼大抵只会减少不会增加,覆盖的话,以前的那些没删的楼层被删了就看不到了,这不是失去了备份的一丝丝的意义吗
事情是这样的, 我很喜欢你的这个作品,很早就Fork下来了,并做了很多的优化和改进。 本来想发 PR ,但是发现内容和master分支差异比较多(大改动),所以如果可以的话,麻烦作者专门开一个分支给我(作为另一个版本),以后我的PR都提交到这个分支,帮助更多的人
一些问题
同时报上一处崩溃 `[!] ERROR: 发生异常: Traceback (most recent call last): File "main.py", line 397, in GetPost(pid,lz,comment) File "main.py", line 341, in GetPost Write(ProcessFloor(fnum,userlist[floor["author_id"]] ["name"],floor["time"],ProcessContent(fnum,floor["content"],0))) File "main.py", line 273, in ProcessContent content+=ProcessVideo(s["link"],s["src"])...
``` [!] ERROR: 发生异常: Traceback (most recent call last): File "c:/Users/Administrator/Git/TiebaBackup-complete/main.py", line 695, in GetPost(pid,lz,comment) File "c:/Users/Administrator/Git/TiebaBackup-complete/main.py", line 518, in GetPost Write(ProcessFloor(fnum,userlist[floor["author_id"]]["name"],floor["time"],ProcessContent(fnum,floor["content"],0))) File "c:/Users/Administrator/Git/TiebaBackup-complete/main.py", line 449, in ProcessContent content+=ProcessVideo(s["link"],s["src"]) KeyError:...
具体就是如果有大概5s的请求超时后 下载子线程就会卡死 不会做出任何反应 *** 我实在不知道有什么办法能解决这个问题 望开发者能尝试修复或给予思路 谢谢
出现问题的帖:http://tieba.baidu.com/p/5195748983,选择了全帖及全评论
今天找到一个脚本,然而纯白小白不会修改,可以麻烦UP看看能整合进去吗? PS:如果某个贴吧精品区未完全恢复的话会报错,所以选了精品区完好的滑稽吧测试,不知道为什么爬下来的帖子总是有楼层违规的提示。 import requests import re import json import time from random import choice from bs4 import BeautifulSoup import Configure header = {'user-agent': choice(Configure.FakeUserAgents)} cookies = {} cookiestr = '''...