Zhihao Zhang

Results 13 comments of Zhihao Zhang

> Try to use ref audio with 0.5s empty voice in the end. how to set this and where can i see the example ?

> @zzhdbw you can use this code to add 0.5s empty voice in the end of a wav file: > > ``` > from scipy.io import wavfile > > rate,...

> Hi there  你好 > > I am facing the same issue on Google Colab. I've switched the version of python to 3.7, but I get the same error.我在 Google...

出现在模型读取阶段,还没有进行训练

> 请问这个错是出在训练阶段吗?我用llama3.2-3B测试了TP=4 finetune似乎没有遇到这个问题。 方便发一下您的环境吗,我照着跑一下看看行不行

感谢您的帮助,经过您的启发,我认为是我自己的运行环境出现问题,由于服务器迁移原因,我从原本的4090-48GB*8服务器切换到了A800-SXM4-80GB服务器,重新安装了环境,经过对比,环境变化如下: cuda==12.8 flash_attn==2.8.3 torch==2.8.0 deepspeed==0.17.6 此时我的脚本运行正常,复盘一下我认为可能是4090服务器没有nvlink导致的初始化问题,不知道有无道理。 综上,我的问题已经解决,感谢您的帮助。

> 我是单独测试了一下deepspeed的autotp训练功能。我把我跑的环境抽了出来,您试试在您的环境下能 不能跑。 https://github.com/delock/deepspeed_finetune_demo > > $ ./run.sh 4 meta-llama/Llama-3.2-3B tp_config.json > > 如果你用的config和这里不一样也可以贴一下,我在我的环境里试试看。 另外我想咨询一下zenflow和openrlhf的关系,问题如下: 1.openrl的tp实现也是使用zenflow实现的吗 2.deepspeed文档中写明了deepspeed的tp目前仅支持推理,为什么能支持训练了呢,是我看的文档过时了嘛 期待您的回复

感谢您的回复,我去学习一下。