Xuejie Zhang
Xuejie Zhang
原来是运行地方错了,需要在根目录下进行微调运行 sh 文件
@MrRexy-Ling , 就是把微调训练的指令放到 shell脚本里,用bash来启动 run.py, 因为需要开启多个进程,所以一般用 .sh文件来执行模型的训练启动,截图上面就是我的 run.sh的内容,
@staoxiao , finetine 代码 是可以用多个gpu进行训练的吗?
@LexieeWei , 你好,请教一下,你的 embedding finetune 微调训练时有没有遇到进程死锁情况, 我在运行官网的指令时在加载完模型,数据后,在训练阶段陷入死锁bug里(见下图) load model: ----------------------------- -----------/home/zhangxj/db/proj/FlagEmbedding-master-------------------------------------- load model: ----------------------------- -----------/home/zhangxj/db/proj/FlagEmbedding-master-------------------------------------- -----------------------------------已开始加载训练数据数据----------------------------------------------- -----------------------------------已开始加载训练数据数据----------------------------------------------- /home/zhangxj/miniconda3/envs/pineconedb/lib/python3.9/site-packages/transformers/optimization.py:391: FutureWarning: This implementation of AdamW is deprecated and will be removed in...
@zoeChen119 , 你微调代码跑起来了吗?,那个multiprocessing.errors.ChildFailedError错误解决了?
@wxl18039675170 , 大佬,你的微调运行shell脚本的参数是如何设置的,可以分享一下吗?我在微调时一直卡顿在多进程死锁上;
@zoeChen119 ,问题解决了吗?怎么解决的,同样遇到上面的问题