Retrieval-based-Voice-Conversion-WebUI 有什麼建議的訓練指南 & index file的疑問?

我準備的所有訓練素材大約時長兩小時左右(唱歌的一小時說話的一小時) 當我把所有訓練素材(說話+唱歌)拿去訓練index檔時訓練好的index檔只有30MB的大小

但是當我將訓練素材裡說話素材去除只留下唱歌素材然後再拿去訓練index檔訓練出的index檔大小卻400MB左右我後續也將這兩個模型訓練完成並分別拿去推理同一首歌聽起來卻是30MB的那個更好、更像所以index file的大小很大代表什麼? 其實我就是好奇index file大小的意義是什麼理論上是400MB比較好還是30MB的那個?

May 13 '24 15:05 touma1434

I have had wondered the same thing about the same file. I am generally curious whether if the larger size file will yield better results if it was used rather than the smaller size file.

May 14 '24 10:05 DEUPLECT

同問此類問題，有沒有個建議的訓練資料量或是流程？或是怎麼判斷訓練的好不好？

Aug 08 '24 10:08 kund3