autosub icon indicating copy to clipboard operation
autosub copied to clipboard

Succeed without any contents in srt file

Open sihunqu123 opened this issue 5 years ago • 16 comments

The converting process succeeds without any warning/error. But there is nothing found in the created srt file, whose input is the song California Dreaming, which should have some English words.

CommandLine contents:

➜  Movies autosub -C 2 -S en -F srt CaliforniaDreaming.flac
Converting speech regions to FLAC files: 100% |#################| Time: 0:00:01
Performing speech recognition: 100% |###########################| Time: 0:03:26
Subtitles file created at CaliforniaDreaming.srt
➜  Movies cat CaliforniaDreaming.srt
1
00:00:37,376 --> 00:00:43,520
Stop
➜  Movies

sihunqu123 avatar May 02 '19 13:05 sihunqu123

The same thing happens on *.mp4 too. Tested with Stratovarius-Forever.mp4

sihunqu123 avatar May 02 '19 14:05 sihunqu123

应该是网络问题,建议更换代理或者使用服务器 当然也有可能是对音乐的识别率较低导致的

BingLingGroup avatar May 03 '19 00:05 BingLingGroup

It's not a problem of network. My network is good, with a good VPN. And I have tried that it would fail when with a poor network, while in my case, the aubsub says it succeed. Anyway, thanks for your comment/reply.

sihunqu123 avatar May 03 '19 14:05 sihunqu123

@sihunqu123 方便的话,可以把音频文件分享出来,让我试试,以排除是音频文件的问题。 有时候网络问题不会被报错,而是产生一个空文件,这我遇到过。

BingLingGroup avatar May 10 '19 00:05 BingLingGroup

Uploaded, Forever.mp4. Also, for convenience, u can ping me via Wechat(my Wechat id is vin7t123), thanks.

sihunqu123 avatar May 18 '19 11:05 sihunqu123

@sihunqu123 方便的话,可以把音频文件分享出来,让我试试,以排除是音频文件的问题。 有时候网络问题不会被报错,而是产生一个空文件,这我遇到过。

我也碰到同样问题,是mp4文件,即使从stereo转换到mono,也是空文件。 VPN上网正常

jun12zh avatar May 21 '19 01:05 jun12zh

Uploaded, Forever.mp4. Also, for convenience, u can ping me via Wechat(my Wechat id is vin7t123), thanks.

@sihunqu123 因为你的视频是音乐视频,所以api无法识别,我在服务器上试过了,也是空的,应该是这个原因。 好比youtube对音乐视频的识别几乎也是不行的一样,目前这套speech-to-text api基本无法识别音乐音频。

BingLingGroup avatar May 23 '19 01:05 BingLingGroup

@sihunqu123 方便的话,可以把音频文件分享出来,让我试试,以排除是音频文件的问题。 有时候网络问题不会被报错,而是产生一个空文件,这我遇到过。

我也碰到同样问题,是mp4文件,即使从stereo转换到mono,也是空文件。 VPN上网正常

@jun12zh 可能是音乐视频的原因导致的,参见楼上。

BingLingGroup avatar May 23 '19 01:05 BingLingGroup

请问可否生成双语? 比如中英? 再就是有批处理就好了。。

goodbyennn avatar May 23 '19 02:05 goodbyennn

Uploaded, Forever.mp4. Also, for convenience, u can ping me via Wechat(my Wechat id is vin7t123), thanks.

@sihunqu123 因为你的视频是音乐视频,所以api无法识别,我在服务器上试过了,也是空的,应该是这个原因。 好比youtube对音乐视频的识别几乎也是不行的一样,目前这套speech-to-text api基本无法识别音乐音频。

So I need to extract the voice from the video file without BGM, and then only try on this voice file?

sihunqu123 avatar May 23 '19 07:05 sihunqu123

请问可否生成双语? 比如中英? 再就是有批处理就好了。。

@goodbyennn 批处理我建议你学一下bash,用bash的循环写命令应该很容易。 双语的话问题在于翻译的部分需要付费API,或者你可以去别人fork的仓库里找,已经有人改了代码加了免费翻译的API,可以去我的博客看看。

BingLingGroup avatar May 26 '19 03:05 BingLingGroup

Uploaded, Forever.mp4. Also, for convenience, u can ping me via Wechat(my Wechat id is vin7t123), thanks.

@sihunqu123 因为你的视频是音乐视频,所以api无法识别,我在服务器上试过了,也是空的,应该是这个原因。 好比youtube对音乐视频的识别几乎也是不行的一样,目前这套speech-to-text api基本无法识别音乐音频。

So I need to extract the voice from the video file without BGM, and then only try on this voice file?

@sihunqu123 跟你抽取音频没关系,它不给你识别就没办法。

BingLingGroup avatar May 26 '19 03:05 BingLingGroup

@BingLingGroup 同样存在输出空文件的问题;输入音频仅包含对话。

autosub -S en -D en output.m4a
Converting speech regions to FLAC files: 100% |######################################| Time: 0:00:21
Performing speech recognition: 100% |################################################| Time: 0:05:38
Subtitles file created at output.srt

附件中的文件为output.m4a的片段。 clip.m4a.zip

WenxingLai avatar May 28 '19 13:05 WenxingLai

@sihunqu123 方便的话,可以把音频文件分享出来,让我试试,以排除是音频文件的问题。 有时候网络问题不会被报错,而是产生一个空文件,这我遇到过。

我也碰到同样问题,是mp4文件,即使从stereo转换到mono,也是空文件。 VPN上网正常

@jun12zh 可能是音乐视频的原因导致的,参见楼上。

@BingLingGroup 用了不带音乐只有对话的,还是空srt文件

jun12zh avatar May 30 '19 10:05 jun12zh

@BingLingGroup 同样存在输出空文件的问题;输入音频仅包含对话。

autosub -S en -D en output.m4a
Converting speech regions to FLAC files: 100% |######################################| Time: 0:00:21
Performing speech recognition: 100% |################################################| Time: 0:05:38
Subtitles file created at output.srt

附件中的文件为output.m4a的片段。 clip.m4a.zip

@WenxingLai 可以识别,你需要反思一下你的网络问题,我是在linux服务器上做的。 clip.srt.zip

BingLingGroup avatar May 31 '19 04:05 BingLingGroup

@sihunqu123 方便的话,可以把音频文件分享出来,让我试试,以排除是音频文件的问题。 有时候网络问题不会被报错,而是产生一个空文件,这我遇到过。

我也碰到同样问题,是mp4文件,即使从stereo转换到mono,也是空文件。 VPN上网正常

@jun12zh 可能是音乐视频的原因导致的,参见楼上。

@BingLingGroup 用了不带音乐只有对话的,还是空srt文件

@jun12zh 参见楼上,我可以用。

BingLingGroup avatar May 31 '19 04:05 BingLingGroup