BingLingGroup
BingLingGroup
字幕压制和封装功能以后考虑会加,目前你可以借助ffmpeg之类的软件进行字幕压制
https://github.com/mawilson1234/autosub 看起来已经有人实现了这个功能,你可以考虑试用下
什么叫合并多行字幕,你是说把同段时间的多个字幕行合并成一行吗,这方面可以用aegisub autosub也支持合并多行字幕,但目前只支持合并ass格式的双语字幕(也就是只支持两种数量最多的样式的字幕行进行合并)
什么叫后续5个页面的字幕,我没理解
``` WARNING: Audio stream has a duration of less than 3 seconds. Normalization may not work. ``` It seems that your audio file is too small to do the processing.
视频的音量是否在-10dB以上?是否有较大的背景噪音?
我刚才测试了一下,一模一样的参数,也是 `-S cmn-hans-cn`,生成了字幕,没有问题。 你需要检查一下你的代理服务器,可能是谷歌不接受你的代理服务器发出的请求。这是很常见的,比如之前本项目的actions中曾有一段语音识别的代码以测试程序能否正常运行,就因为测试服务器似乎不能从api中得到请求所以总是识别失败,所以后来删掉了那段代码。 关于这个api,我不太清楚你有没有看原项目 https://github.com/agermanidis/autosub/issues/111 ,因为是别人逆向出来的免费api,所以本项目并不负责这个api的有效性,如果哪一天谷歌突然关掉这个api,或者这个api封锁了某些ip,那么本项目并不会负责这些事情的处理。
当然你也可以使用autosub自带的设置proxy环境变量的参数来使用代理,不过这个方法就和你在终端里自己输入是一样的,相关代码 https://github.com/BingLingGroup/autosub/blob/dev/autosub/__init__.py#L47-L57
那就是你的网络问题了,怎么可能没调接口,我无法复现
#168 这位显然用讯飞没啥问题,说明不是程序的问题。我大概至少半年前也用过目前repo里关于讯飞识别的代码,也是没问题的,可以说代码就是没问题的。 你可以考虑自己装开发环境单步调试。