MockingBird icon indicating copy to clipboard operation
MockingBird copied to clipboard

分享合成器模型

Open HexBanana opened this issue 2 years ago • 22 comments

https://drive.google.com/file/d/1l9MM4WKvYIdZzC0PINPiizl-rJTqPa7u/view?usp=sharing 使用aidatatang_200zh训练集 9k左右注意力开始收敛,12k左右loss降到0.4,现在训练到20k,loss在0.36和0.37之间波动,我怀疑是过拟合了 还有更多模型正在训练

HexBanana avatar Oct 11 '22 04:10 HexBanana

补充一下,使用的最新版本,训练 0.0.1版本用不了

HexBanana avatar Oct 11 '22 04:10 HexBanana

aidatatang_200zh训练集

请问batch_size是多少跑的 过拟合有改batch_size继续跑吗

twj515895394 avatar Oct 11 '22 09:10 twj515895394

aidatatang_200zh训练集

请问batch_size是多少跑的 过拟合有改batch_size继续跑吗

batchsize0-10k用的32,10k-15k用的64,发现效果不理想后改成50训练到20k

HexBanana avatar Oct 12 '22 01:10 HexBanana

aidatatang_200zh训练集

请问batch_size是多少跑的 过拟合有改batch_size继续跑吗

我现在正在重新训练新模型,可能是运气好,这次的模型3.5k就出现注意力模型了,8k loss就0.4了,可以期待一下

HexBanana avatar Oct 12 '22 01:10 HexBanana

我用三个数据集做的预训练 然后跑训练模型 到loss0.39 就出现过拟合了,怎么调整都没用。。。难道是数据集太大loss下不去了?0.39持续了50k左右 一直下不去。。。

twj515895394 avatar Oct 12 '22 02:10 twj515895394

我用三个数据集做的预训练 然后跑训练模型 到loss0.39 就出现过拟合了,怎么调整都没用。。。难道是数据集太大loss下不去了?0.39持续了50k左右 一直下不去。。。

你的batch szie是多少

HexBanana avatar Oct 12 '22 02:10 HexBanana

我用三个数据集做的预训练 然后跑训练模型 到loss0.39 就出现过拟合了,怎么调整都没用。。。难道是数据集太大loss下不去了?0.39持续了50k左右 一直下不去。。。

你的batch szie是多少

我显卡比较差 3060ti的 用的batch_size 24 再高就报错了

twj515895394 avatar Oct 12 '22 02:10 twj515895394

我用三个数据集做的预训练 然后跑训练模型 到loss0.39 就出现过拟合了,怎么调整都没用。。。难道是数据集太大loss下不去了?0.39持续了50k左右 一直下不去。。。

其实loss也不是越低越好,太低可能是过拟合。我试了一下我的模型和作者的模型效果差不多

HexBanana avatar Oct 12 '22 02:10 HexBanana

我用三个数据集做的预训练 然后跑训练模型 到loss0.39 就出现过拟合了,怎么调整都没用。。。难道是数据集太大loss下不去了?0.39持续了50k左右 一直下不去。。。

其实loss也不是越低越好,太低可能是过拟合。我试了一下我的模型和作者的模型效果差不多

确实是的 我自己测试了下 效果还是可以的 我打算重新训练一个 前面60kstep之前都用默认的batch_size(12),后面再慢慢调高试试

twj515895394 avatar Oct 12 '22 02:10 twj515895394

我用三个数据集做的预训练 然后跑训练模型 到loss0.39 就出现过拟合了,怎么调整都没用。。。难道是数据集太大loss下不去了?0.39持续了50k左右 一直下不去。。。

你的batch szie是多少

我显卡比较差 3060ti的 用的batch_size 24 再高就报错了

一直下不去不一定是过拟合,可能真的陷入局部最优解了。我的模型是因为效果差所以才怀疑过拟合的,你应该实测看看效果如何

HexBanana avatar Oct 12 '22 02:10 HexBanana

我用三个数据集做的预训练 然后跑训练模型 到loss0.39 就出现过拟合了,怎么调整都没用。。。难道是数据集太大loss下不去了?0.39持续了50k左右 一直下不去。。。

其实loss也不是越低越好,太低可能是过拟合。我试了一下我的模型和作者的模型效果差不多

确实是的 我自己测试了下 效果还是可以的 我打算重新训练一个 前面60kstep之前都用默认的batch_size(12),后面再慢慢调高试试

如果觉得是batchsize的锅不如和我一起白嫖colab吧

HexBanana avatar Oct 12 '22 02:10 HexBanana

我用三个数据集做的预训练 然后跑训练模型 到loss0.39 就出现过拟合了,怎么调整都没用。。。难道是数据集太大loss下不去了?0.39持续了50k左右 一直下不去。。。

你的batch szie是多少

我显卡比较差 3060ti的 用的batch_size 24 再高就报错了

一直下不去不一定是过拟合,可能真的陷入局部最优解了。我的模型是因为效果差所以才怀疑过拟合的,你应该实测看看效果如何

嗯嗯 可能是的 所以我打算相同数据集 不同方式都训练试试,最终比较下效果,找到最优的训练方案 😄

twj515895394 avatar Oct 12 '22 02:10 twj515895394

反正我的方法就是无脑调大batchsize,效果挺明显的。其他参数懒得调了。32是9k出现注意力,12k loss到0.4。50是3.5k出现注意力,8k到0.4,可以参考参考

HexBanana avatar Oct 12 '22 02:10 HexBanana

attention_step_18500_sample_1 step-18500-mel-spectrogram_sample_1 这是模型训练到18,5k时的图片,后面的效果差不多就不放了

HexBanana avatar Oct 12 '22 02:10 HexBanana

loss中间有一次下降到过0.29,后来又飙到0.5,看来训练还是不够,有兴趣的人可以接着我的模型训练

HexBanana avatar Oct 12 '22 02:10 HexBanana

我用三个数据集做的预训练 然后跑训练模型 到loss0.39 就出现过拟合了,怎么调整都没用。。。难道是数据集太大loss下不去了?0.39持续了50k左右 一直下不去。。。

其实loss也不是越低越好,太低可能是过拟合。我试了一下我的模型和作者的模型效果差不多

确实是的 我自己测试了下 效果还是可以的 我打算重新训练一个 前面60kstep之前都用默认的batch_size(12),后面再慢慢调高试试

如果觉得是batchsize的锅不如和我一起白嫖colab吧 colab 没玩过 这个项目不是还要[ffmpeg]之类的吗 好像挺麻烦的吧 你这边有命令文件分享下吗

twj515895394 avatar Oct 12 '22 13:10 twj515895394

不用ffmpeg,ffmpeg是处理视频的。命令在上个issue也就是764号issue里面有,训练集都预处理好了

HexBanana avatar Oct 12 '22 15:10 HexBanana

colab 没玩过 这个项目不是还要[ffmpeg]之类的吗 好像挺麻烦的吧 你这边有命令文件分享下吗 温馨提示:需要科学上网

HexBanana avatar Oct 12 '22 15:10 HexBanana

colab 没玩过 这个项目不是还要[ffmpeg]之类的吗 好像挺麻烦的吧 你这边有命令文件分享下吗 但是colab有一个好处,免费白嫖tesla t4(相当于2080ti频率降低换16g显存),70/月就能用tesla v100(32g显存,batch size估计100都不是问题)

HexBanana avatar Oct 12 '22 15:10 HexBanana

非常感谢,期待新的模型

klaytonandehud avatar Oct 22 '22 09:10 klaytonandehud

试听了一下模型效果,还是很好的!而且听出作者是用男声训练的?期待更多模型

klaytonandehud avatar Oct 22 '22 10:10 klaytonandehud

试听了一下模型效果,还是很好的!而且听出作者是用男声训练的?期待更多模型

现在才看到回复😅我用的是aidatatang200zh数据集,数据集里面男声多还是女声多这个没注意

HexBanana avatar Nov 17 '22 15:11 HexBanana