Retrieval-based-Voice-Conversion-WebUI
Retrieval-based-Voice-Conversion-WebUI copied to clipboard
有什麼建議的訓練指南 & index file的疑問?
我準備的所有訓練素材大約時長兩小時左右(唱歌的一小時 說話的一小時) 當我把所有訓練素材(說話+唱歌)拿去訓練index檔時 訓練好的index檔只有30MB的大小
但是當我將訓練素材裡說話素材去除 只留下唱歌素材 然後再拿去訓練index檔 訓練出的index檔大小卻400MB左右 我後續也將這兩個模型訓練完成 並分別拿去推理同一首歌 聽起來卻是30MB的那個更好、更像 所以index file的大小很大代表什麼? 其實我就是好奇index file大小的意義是什麼 理論上是400MB比較好還是30MB的那個?
I have had wondered the same thing about the same file. I am generally curious whether if the larger size file will yield better results if it was used rather than the smaller size file.
同問此類問題,有沒有個建議的訓練資料量或是流程? 或是怎麼判斷訓練的好不好?