168liuliu168

Results 6 comments of 168liuliu168

确实,我放到vim里面发现换行符颜色都不对,现在修改可以运行但是会报错端口问题 ValueError: The port number of the rendezvous endpoint 'None:None' must be an integer between 0 and 65536. 这个是需要在哪里进行配置或是指定呢?

@gg22mm 多卡训练的问题你那边有进展吗?我这边也是四个11G的显卡 使用CUDA_VISIBLE_DEVICES=0,1,2,3 没有任何效果。还是只在一个卡上跑。

我知道,所以我想问一下有没有其它的解决方案呢?官方的多卡方式是无法使用的,就卡在一个尴尬的内存上。

你这边版本是多少?我现在是12.1,我个人感觉也这个版本也没有什么关系。

![image](https://user-images.githubusercontent.com/131579549/233833158-4dad9ede-b5d0-4917-ab31-7368d58df746.png) 我这边确实是12.1的 不会因为我的太高了?

![image](https://user-images.githubusercontent.com/131579549/233911306-6041a085-5951-4e06-aa55-3e4aa5fb3060.png) ![image](https://user-images.githubusercontent.com/131579549/233911349-dc2c3694-da98-4f20-aff4-2fdf44026d7b.png) 上面那个报错是我试用了int4量化后的模型没有基于正常的6B模型,但是我修改后还是显存不足,我看确实试用了多个显卡。 但是单个显卡11G 是不是不足以支撑模型训练的启动啊。 前两天看官方的github上也有反馈类似问题的,有人说11G 显存是无法启动多卡训练的(单卡正常)