[自动无缝翻页] 希望添加 哔哩轻小说 页面文字监听功能
功能需求
(这个功能要求可能比较偏,针对的人数比较少,如果无法实现,还请直接closed)
由于这种情况并非插件本事造成的bug所以放在了功能添加这一类。
之前反馈的同一网站的反爬问题https://github.com/XIU2/UserScript/issues/552
在使用edge浏览器自带的朗读功能,阅读屏幕上的小说时,出现串行或者串段的情况(绝不是tts的问题)
之前情况表现为:在用搜索(Ctrl+F)网页内容时,关键词搜索到两条,一条正文里没有出现,一条正文中出现了(正常情况下只会出现一个)
但在今天发现,之前修复的更新了,现在串段是随机的,不像之前一样,
(录的有视频,但死活添加不上附件,而且竟然没有声音)
如何复现:不添加任何脚本情况下打开此网站https://www.bilinovel.com/novel/2890/300056.html
用浏览器自带的(我用的edge)tts功能朗读文本内容,,由我的手机出现情况,下不出两段就会出现串段,由于与之间固定串段情况不同,所以我不能在这里直接标注到底是哪一段串哪一段
我与网站的管理员之间交流的,一个月前,所以我希望本插件可以另外帮我解决这个问题!
预期目标
希望插件可以修复,让tts正确朗读的文本所显示的内容, 好像不能怨tts吧() (这东西为啥会朗读的文本以外的内容?) 私は本当に仕方がありません!
应该就是反爬机制引起的问题,我刚才又看了一下网站回忆了一下当初写规则时的情况,该网站的反爬机制就是会在网页正文中参杂一些重复无关的段落,网站会通过 CSS 样式来将这些无关内容隐藏起来,这样爬虫爬取的时候就会获得被掺了料的正文内容,而你说的浏览器朗读,应该是不会自动判断文字段落是否是可见的,因而导致不管是什么都一股脑念出来了。
通过查看网页元素就能发现,比如下图里,正文第一句前面就有个隐藏的文字段落(这句话直接 Ctrl+F 搜索也会发现有 2 个搜索结果,这句话正确位置是在稍后几段那里)。
因此,我不会去解决这种网站故意为之而引起的问题,这不应该我来解决(而且我来处理的话还很麻烦)。 而你就算找网站管理员他应该也不会处理,因为这就是他设计好的反爬虫机制,只是遇到你这个小众需求才出现兼容性问题了,因此不大可能为了你这个小众需求而重新设计一套反爬虫机制。。。
另外,该脚本只会实现和自动翻页相关的功能,并不考虑添加其他针对单个网站的功能。