modelscope
modelscope copied to clipboard
Removing weight norm...
合成语音时: Removing weight norm... 消失太多时间了,可以优化吗?
具体什么模型? 消失太多时间是指卡在哪里太久了么?
具体什么模型? 消失太多时间是指卡在哪里太久了么?
模型:speech_tts/speech_sambert-hifigan_tts_ainan_zh-cn_16k
请问“Removing weight norm...” 是在做什么工作? 耗时了16秒,一直会报“Load pinyin_en_mix_dict failed”
“Load pinyin_en_mix_dict failed”可以忽略,“Removing weight norm...”是vocoder模型推理前的日志,这个模型建议在gpu上推理
是在用GPU的环境呀
用的是GPU,跑起来显存占用3G左右,试了好多次,200个字,总耗时都在22秒
本地测试,耗时跟你的情况差不多。tts给出的优化建议:speech_sambert-hifigan_tts_zh-cn_16k这个模型vocoder可以导出成onnx然后用tensorrt转换后推理,性能可以提升不少;另外对于am可以采用多个instance的方式来并行推理,可以考虑使用c++代码实现其内部部分网络的推理。
This issue is stale because it has been open 30 days with no activity. Remove stale label or comment or this will be closed in 5 days.
This issue was closed because it has been stalled for 5 days with no activity.