aihu8338
Results
3
comments of
aihu8338
@lipku ------actual avg infer fps:25.8044 ------actual avg final fps:24.9966
经过测试发现,hubert的处理速度非常快,上述视频的音频总处理时长仅有0.23秒: ``` SR: 24000 to 16000 time 0.024374520406126976 hubert time 0.21406333334743977 ``` 因此不需要实时流式处理,只需要适当断句避免音频过长,然后分段处理即可。这么修改后出来的视频看上去是正常了。 这么做大概还可以解决视频推理速度慢导致音视频不同步、卡顿的问题。
@vipxiaoma 没有实现,只是猜测可能可以解决。