Dr. Artificial曾小健 comments

Results 54 comments of


                                            Dr. Artificial曾小健

微调chatglm2后进行预测出现大量复读现象

> > > rank32 学习率1e-3 epoch20~30可以解决问题 > > > > > > 借了大佬的参数，感觉还是不行，特别是回答数据比较短的时候，特别明显啊。各位大佬可有建议？ > > 更新代码版本了吗？您是说更新 ChatGLM2 的官方代码吗

微调chatglm2后进行预测出现大量复读现象

> > rank32 学习率1e-3 epoch20~30可以解决问题 > > 借了大佬的参数，感觉还是不行，特别是回答数据比较短的时候，特别明显啊。各位大佬可有建议？现在解决了吗

> > > > > > > > > 更新了，这个改掉了。 ![image](https://user-images.githubusercontent.com/31723852/249967047-799d6389-05ba-426c-bbf5-395937df2b80.png) ![image](https://user-images.githubusercontent.com/31723852/249967205-2d33dca5-022d-47d3-be91-a5e34fdf4b6c.png) 但是，好奇怪，pad给的是unk，感觉预训练阶段没有pad这个token？ > > 我自己在special token里面加上了pad，微调之后不会出现停不下来的情况，但是训练时loss一个epoch之后会上升 ![image](https://user-images.githubusercontent.com/51474616/249974698-3d2c1ce1-9941-40b8-bb32-47ea1e21b84d.png) 代码里面attention mask和position id的产生逻辑和glm1不一样了，我改了一下可能还是有点问题这个具体怎么操作啊。怎么在special token里面加上pad

Dr. Artificial曾小健

有时候输出会很奇怪，全是逗号

[BUG/Help] <输入长串数字乘法程序挂死>

微调chatglm2后进行预测出现大量复读现象

微调chatglm2后进行预测出现大量复读现象

eos和pad token id 一样

eos和pad token id 一样

eos和pad token id 一样

[BUG/Help] <title>不断循环输出无意义字符。长度已经限制seq len 128，也用了quantitazation

[BUG/Help] <title>不断循环输出无意义字符。长度已经限制seq len 128，也用了quantitazation

[BUG/Help] <title>不断循环输出无意义字符。长度已经限制seq len 128，也用了quantitazation