cywjava comments

Results 91 comments of


                                            cywjava

train.py报错ZeroDivisionError: division by zero

是你的txt 语料，处理成一行一句话，文件末尾不能有换行

可以使用自己的数据微调吗

可以的吧，我也是参考别人修改的微调，做了一个，把数据放进去，处理成要的格式不就行了吗？ https://github.com/chenyiwan/chatglm-6b-fine-tuning

finetune的时候加上 --fp16报错，RuntimeError: expected scalar type Half but found Float

你加载模型时，是不是.float（）啊

想保留原有的对话能力并增加现有的问题处理对话哪种更适合呢？lora还是ptuning？？？我还有个疑问，#413 说到ptuning微调之后就只支持当前任务了，这种同样是对话的任务微调之后之前的对话能力是否也会变差？如果想保留原有的对话能力并增加现有的问题处理对话是不是使用lora更适合？

Lora 训练新知识，我试了一下几千步就可以了，要是几万步，反而推理结果更差

> 我用是用的超微，5张3090 24GB ，插了两张NVLINK,我也没觉得有多快。。 ![image](https://user-images.githubusercontent.com/56297473/236371226-bb70048f-6224-444a-bbb7-50aa2b243a9f.png) 另外还有一台超微 8卡 P40 24gb，全拿来做推理了。 > 我当然知道，目前是打算拿下一块超微的主板，双路CPU，每一路包含4个pcie3.0 x16，但是我仍然不确定没有nvlink的情况下带宽瓶颈有多严重。根据经验，多卡训练的主要瓶颈就是带宽（而不是Flops），一般来说nvlink可以提供上百G的带宽，而pcie3.0 x16只有16G每秒，pcie4.0 x16只有32G每秒 > […](#) > On Fri, May 5, 2023 at 1:10 AM Hang Yu @ DigiPen ***@***.***>...

cywjava

train.py报错ZeroDivisionError: division by zero

可以使用自己的数据微调吗

finetune的时候加上 --fp16报错，RuntimeError: expected scalar type Half but found Float

[BUG/Help] 3090双卡训练比单卡慢出一倍以上

[BUG/Help] 3090双卡训练比单卡慢出一倍以上

[BUG/Help] 显存爆满后无法释放

[BUG/Help] <title>大佬，能基于infer_lora_finetuning.py 的lora微调版本，提供一个flask的部署代码吗

[BUG/Help] <title>大佬，能基于infer_lora_finetuning.py 的lora微调版本，提供一个flask的部署代码吗

[BUG/Help] <请问做了广告文案的P-tuning后，对其他意图的响应都乱了，这个问题怎么解决？>