TFGAN-PLC icon indicating copy to clipboard operation
TFGAN-PLC copied to clipboard

论文中loss计算和训练脚本不一致问题

Open xiaoqiang306 opened this issue 2 years ago • 1 comments

你好请教下,复现过程中,发现论文中loss计算与训练脚本有几点不一致: 1、论文中wav discriminator和spec discriminator 的loss是不同权重的,通过λ参数指定,训练代码是1比1直接相加 2、训练脚本中,generator loss增加了multi-resolution STFT loss,论文中没有 训练脚本的改动是优化改动,还是应该手动改成和论文一致?

另外一个问题是模型(默认非因果版本代码,slice len和shift都为2560(帧长160ms))输出,在每个帧(160ms)拼接处都会存在噪点,请较这个问题该如何优化?

xiaoqiang306 avatar Sep 23 '22 07:09 xiaoqiang306

多分辨率STFT损失应该是优化改动,其他的不太记得了。拼接处的噪点是我们在plc challenge时碰到的较为头疼的问题,我们当时的方案是加一个基于语音增强的实时后处理算法

------------------ 原始邮件 ------------------ 发件人: "Guanyuansheng/TFGAN-PLC" @.>; 发送时间: 2022年9月23日(星期五) 下午3:21 @.>; @.***>; 主题: [Guanyuansheng/TFGAN-PLC] 论文中loss计算和训练脚本不一致问题 (Issue #9)

你好请教下,复现过程中,发现论文中loss计算与训练脚本有几点不一致: 1、论文中wav discriminator和spec discriminator 的loss是不同权重的,通过λ参数指定,训练代码是1比1直接相加 2、训练脚本中,generator loss增加了multi-resolution STFT loss,论文中没有 训练脚本的改动是优化改动,还是应该手动改成和论文一致?

另外一个问题是模型(默认非因果版本代码,slice len和shift都为2560(帧长160ms))输出,在每个帧(160ms)拼接处都会存在噪点,请较这个问题该如何优化?

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>

Guanyuansheng avatar Sep 23 '22 08:09 Guanyuansheng