Algebra-FUN
Algebra-FUN
确实是有通过使用特定字库进行反爬虫的操作,但是今天我自己运行了一遍,并没有出现这样的问题,所以应该不是反爬虫操作造成的。 这个问题可能是由于你的设备本身缺少字库造成的。 可以直接运行 ```python from selenium.webdriver import Chrome driver = Chrome() driver.get('https://weread.qq.com/web/reader/50532a905cde3050538da2b') input() ``` 观察是否将文字渲染了出来
目前只能扫描解锁的内容,如果用户在微信读书中没有获取这本书(指购买或者使用免费无限卡),将无法扫描锁定的部分 如果不是这个原因的话,可能是网络原因或者其他问题,详细debug需要反馈“报错”的输出内容
事实上,selenium对于尺寸大的网页的sreenshot本身就是糊的……,所以这里算是系统性的缺陷吧,之前我也搜索过解决方案,但都不能较好的解决问题
> > 事实上,selenium对于尺寸大的网页的sreenshot本身就是糊的……,所以这里算是系统性的缺陷吧,之前我也搜索过解决方案,但都不能较好的解决问题 > > 可以试试滚动截图。而不是简单粗暴地直接用selenium的无头截图。通过selenium执行js,把比例放大到150%。 首先,感谢你对本项目的关注。我考虑过这个解决方案,但奈何我正处于考研时期,所以暂时无瑕顾及该项目的后续升级迭代工作,请谅解
@waynevan 抱歉,没有及时回复,本人大三,学业繁忙,无暇顾及,望谅解
> https://ibb.co/KDqpXKj 这个是应为“章节名称”中“建立发送/接受”中“/”所导致的,这个与路径用的"/"重复; 确实我开发经验不足,没有考虑到这些特殊字符的影响,没有做"Escape Character",是我的失误,感谢你的反馈
> 可以用uuid模块,用于解决书名和章节名中有特殊字符的情况 生成如下的目录/文件: `wrs-temp/88bda22c-cbab-459b-a7ca-430301e0347a/aea20dc8-44cc-4a61-b781-5c370956f918.png` > > ``` > #import uuid > > book_dir_name = str(uuid.uuid4()) > dir_check(f'wrs-temp/{book_dir_name}') > ...... > png_name = f'wrs-temp/{book_dir_name}/{str(uuid.uuid4())}' > ``` Good suggestion. It's a good...
请问你使用的是ChromeDriver吗?因为不同的WebDriver在headless模式下的渲染方式是不一样的,所以有些浏览器可能会造成element没有全部渲染 推荐使用ChromeDriver
> > 请问你使用的是ChromeDriver吗?因为不同的WebDriver在headless模式下的渲染方式是不一样的,所以有些浏览器可能会造成element没有全部渲染 > > 推荐使用ChromeDriver > > > 是使用的ChromeDriver。 > > 所以,没话说了?@Algebra-FUN > 最近一次commits 显示2021年2月7日,也没解决这个问题,我下载了,还是报这个错误 @ivoidcat @snow212-cn 抱歉,没有及时回复,本人大三,学业繁忙,无暇顾及,望谅解
> > > > **Algebra-FUN** added the bug label yesterday > > ⬆︎⬆︎⬆︎ 真是搞笑 ⬆︎⬆︎⬆︎。 @snow212-cn bug fix不了被鸽,是个很正常的现象。github很多上千star的repo也有不少issues一鸽就是半年的。所以这很正常