chen333
chen333
> 您好,每一次我用jieba进行分词的时候,都会有 > > ``` > Building prefix dict from the default dictionary ... > Loading model from cache /tmp/jieba.cache > Loading model cost 0.128 seconds. > Prefix dict has...
> @MrRexy-Ling , 就是把微调训练的指令放到 shell脚本里,用bash来启动 run.py, 因为需要开启多个进程,所以一般用 .sh文件来执行模型的训练启动,截图上面就是我的 run.sh的内容, 我将运行的指令放到shell脚本运行,依然报这种错误,怎么解决呢?
> 这个应该是deepspeed配置的问题,有一个类似的issue:#43 > > 查了一下可能的解决方案: > > * `apt-get update; apt-get install ninja-build` > * 把cuda版本从10.1升级到10.2([https://github.com/microsoft/DeepSpeed/issues/694)](https://github.com/microsoft/DeepSpeed/issues/694%EF%BC%89) 我的CUDA版本是12.0 也是这个问题
> > /opt/conda/lib/python3.10/site-packages/torch/include/ATen/cuda/CUDAContext.h:10:10: fatal error: cusolverDn.h: No such file or directory > > #include > > 问题解决了,可以训练啦!!主要是cusolverDn.h: No such file or directory 找不到导致; 添加环境变量,export PATH=/usr/local/cuda/bin:$PATH 在哪添加呢
> pip uninstall deepspeed DS_BUILD_FUSED_ADAM=1 pip install deepspeed 以上不行的话再试试 git clone https://github.com/microsoft/DeepSpeed.git cd DeepSpeed DS_BUILD_FUSED_ADAM=1 pip3 install . 还是不行的话,提出你的错误 pip uninstall deepspeed DS_BUILD_FUSED_ADAM=1 pip install deepspeed 进行了上述操作依然出现这个报错 File "/home/nbicc/data/anaconda3/envs/visualglm/lib/python3.8/site-packages/torch/utils/cpp_extension.py", line...
> > /opt/conda/lib/python3.10/site-packages/torch/include/ATen/cuda/CUDAContext.h:10:10: fatal error: cusolverDn.h: No such file or directory > > #include > > 问题解决了,可以训练啦!!主要是cusolverDn.h: No such file or directory 找不到导致; 添加环境变量,export PATH=/usr/local/cuda/bin:$PATH 我输入 vi ~/.bashrc命令,在底下添加了环境变量export PATH=/usr/local/cuda/bin:$PATH依然出现这个问题nsion.py", line...
> > tokenizer的问题可以参考这里:[#111 (comment)](https://github.com/THUDM/VisualGLM-6B/issues/111#issuecomment-1579019781) > > tokenzier重新运行是正常;  > > 主要是后面的问题: RuntimeError: Error building extension 'fused_adam',详情见上面; 问题已全部解决,微调成功
> > > tokenizer的问题可以参考这里:[#111 (comment)](https://github.com/THUDM/VisualGLM-6B/issues/111#issuecomment-1579019781) > > > > > > tokenzier重新运行是正常;  > > 主要是后面的问题: RuntimeError: Error building extension 'fused_adam',详情见上面; > > 问题已全部解决,微调成功 推理微调后的模型权重文件时出现: File "/home/nbicc/data/anaconda3/envs/lm/lib/python3.8/site-packages/transformers/utils/hub.py", line 469, in...
> > > > tokenizer的问题可以参考这里:[#111 (comment)](https://github.com/THUDM/VisualGLM-6B/issues/111#issuecomment-1579019781) > > > > > > > > > tokenzier重新运行是正常;  > > > 主要是后面的问题: RuntimeError: Error building extension 'fused_adam',详情见上面; > > > >...
>  请问在阿里云上部署,连接不上huggingface网站的问题怎么解决呀? 下载到阿里云服务器使用