LiuMY13
LiuMY13
”tokenize部分 更像是在扩大词表,训speech的文本语料。“原文就是这样写的啊。train部分
跑interactive_demo不够
I successfully run interactive demo in 4 A100 80G. And this is the resources I used. 
不需要训练,文件全,可以跑
--preprocessing_num_workers 100 调小到4 --gradient_accumulation_steps 16调小到1 我是这样勉强能泡,但是训练效果不好,因为batchsize太小了。我使用的是4张a100,80G