168liuliu168
168liuliu168
确实,我放到vim里面发现换行符颜色都不对,现在修改可以运行但是会报错端口问题 ValueError: The port number of the rendezvous endpoint 'None:None' must be an integer between 0 and 65536. 这个是需要在哪里进行配置或是指定呢?
@gg22mm 多卡训练的问题你那边有进展吗?我这边也是四个11G的显卡 使用CUDA_VISIBLE_DEVICES=0,1,2,3 没有任何效果。还是只在一个卡上跑。
我知道,所以我想问一下有没有其它的解决方案呢?官方的多卡方式是无法使用的,就卡在一个尴尬的内存上。
你这边版本是多少?我现在是12.1,我个人感觉也这个版本也没有什么关系。
 我这边确实是12.1的 不会因为我的太高了?
  上面那个报错是我试用了int4量化后的模型没有基于正常的6B模型,但是我修改后还是显存不足,我看确实试用了多个显卡。 但是单个显卡11G 是不是不足以支撑模型训练的启动啊。 前两天看官方的github上也有反馈类似问题的,有人说11G 显存是无法启动多卡训练的(单卡正常)