vits_chinese icon indicating copy to clipboard operation
vits_chinese copied to clipboard

segment_size 对不同数据集有影响吗?

Open liroda opened this issue 1 year ago • 6 comments

您好,请教一下,我的音频大概平均时长是4s左右,有25%的音频在5s 以上,最长10s,这里的segment_size设置需要变大吗?segment_size 太大GPU卡卡显存可能不够用,segment_size 在实际训练是在decoder 部分,只选取一段进行训练吗?这种对长音频的训练为了充分利用数据,需要前提先做一下截取到一个时长范围吗?

liroda avatar Apr 26 '23 10:04 liroda