whisper-vits-svc icon indicating copy to clipboard operation
whisper-vits-svc copied to clipboard

whisper長度切割問題

Open Taiwan1912 opened this issue 1 year ago • 1 comments

有看到說明文檔whisper要少於30秒 那麼想請問如果刻意把音頻都分割為30秒 且batch_size開到最大做訓練 那麼跟正常切割2~15秒做訓練 會有好壞的差異嗎

我自己做實驗機器跑得起來 每次epoch的步數降很低 模型覺得之前好一點 但可能是自我感覺良好

Taiwan1912 avatar Oct 06 '23 05:10 Taiwan1912

那麼想請問如果刻意把音頻都分割為30秒 那麼跟正常切割2~15秒做訓練

应该没什么区别,同样的数据、不同batch_size和learning_rate会影响结果

MaxMax2016 avatar Oct 07 '23 05:10 MaxMax2016