whisper-vits-svc
whisper-vits-svc copied to clipboard
whisper長度切割問題
有看到說明文檔whisper要少於30秒 那麼想請問如果刻意把音頻都分割為30秒 且batch_size開到最大做訓練 那麼跟正常切割2~15秒做訓練 會有好壞的差異嗎
我自己做實驗機器跑得起來 每次epoch的步數降很低 模型覺得之前好一點 但可能是自我感覺良好
那麼想請問如果刻意把音頻都分割為30秒 那麼跟正常切割2~15秒做訓練
应该没什么区别,同样的数据、不同batch_size和learning_rate会影响结果