Kristopher-Chen
Kristopher-Chen
> I am still getting this error > > ``` > ConfigKeyError: Key 'eval_wer' not in 'AudioPretrainingConfig' > full_key: eval_wer > reference_type=Optional[AudioPretrainingConfig] > object_type=AudioPretrainingConfig > ``` > > while running...
> You can solve this by cloning the repo, and then just copying all those missing parameters from the audio fine-tuning config into the audio pretraining config did not get...
> eval_wer @patrickvonplaten Hi, I think I got it. I copied the parameters \fairseq\fairseq\tasks\audio_finetuning.py (AudioFinetuningConfig) to audio_pretraining.py (AudioPretrainingConfig). Is that what you meant? One more question, it seems the frame...
> 这是由于版本更新导致的问题,使用旧版本的dump_data则不会出现此问题。 请问是基于哪个分支的呢
> 您好,请问您当时对应的旧版本是回退到哪一个commit的呢,我尝试了之前的旧版本,最终训练的loss从5.2左右经过训练下降到4.0左右,但使用test生成的语音效果非常差,主要表现为幅值超限严重,请问您这边有遇到过这样的问题吗? 类似的现象,搞定了吗
> 你现在是用的哪个版本做得
> > > > > > > > > 你现在是用的哪个版本做得 > > 忘记了,对照这里的上传时间找的mozilla那边的git回退回去在那个时间之前的版本 有空帮忙git branch,多谢 然后你说的‘把源程序中反复读取进行数据增强的部分给去掉了‘具体指的是什么?,只是把这个计数去掉了吗 if (count*FRAME_SIZE_5MS>=10000000 && one_pass_completed) break;
话说数据集换了的话,稀疏的那几个参数需要怎么配置呢,原始的话可能10个epoch就到了
> > 话说数据集换了的话,稀疏的那几个参数需要怎么配置呢,原始的话可能10个epoch就到了 > > 我没有改其他的东西,只是把epochs调大了,因为我初始的loss会在5.2左右需要更多的轮数,不知道为什么大家的第一轮都只有3左右 我也是,第一轮5.3,跑了二三十轮还有4.6