Yaodada12
Yaodada12
我遇到类似的问题,训练过程中这一行代码产生了报错: ``` scaler.scale(loss_gen_all).backward() ``` 报错信息如下: ``` RuntimeError: [../third_party/gloo/gloo/transport/tcp/pair.cc:589] Read error [192.168.70.92]:25266: Connection reset by peer ```
> 我遇到类似的问题,训练过程中这一行代码产生了报错: > > ``` > scaler.scale(loss_gen_all).backward() > ``` > > 报错信息如下: > > ``` > RuntimeError: [../third_party/gloo/gloo/transport/tcp/pair.cc:589] Read error [192.168.70.92]:25266: Connection reset by peer > ``` @RVC-Boss 而且正常是2分钟200 step,但是报错之前跑200个step用了2小时,这是什么鬼。...
我预编译了多个静态图,每个都可能用到,不能删除。大佬,有其他针对静态图的显存回收方法吗
> 预编译很多静态图,是为了在一台机器上支持很多个模型的推理服务么 模型输入尺寸是动态的,不想每次新的尺寸输入就编译一次(主要模型大编译时间太长),所以一次性都编译了。大佬有什么解决办法吗?
> 静态图下彻底解决动态 shape 的问题还在讨论中,预计在将来的版本中解决。 期待!大概哪个版本能解决这个问题,大概要多场时间,比如3个月?6个月?1年?
> I was getting this feedback on a dual 3060 (12gb ea) as well as a 1660ti you can try my way. https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/issues/165#issuecomment-1524532607
@nonametao @pamzerbhu @RVC-Boss 大佬们进展如何啊?我最近在做RVC的mac端部署,但是发现hubert模型转不了coreml。大佬们有尝试嘛?这里是我遇到的问题:[https://github.com/apple/coremltools/issues/2099](url)
RuntimeError: PyTorch convert function for op 'all' not implemented.
> : Thank you for your help,you can find hubert_base.pt in [https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main](url),and replace in_feats=torch.rand([1, 64000])
估计是裁剪完的网络通道数不是2^n,导致再GPU上并行加速效果下降,推理时间就增加了。CPU上应该会有速度提升。