ChatGLM-Tuning icon indicating copy to clipboard operation
ChatGLM-Tuning copied to clipboard

试了下中文instrcut数据微调,效果好像还行

Open 27182812 opened this issue 1 year ago • 14 comments

See this in detail:https://github.com/27182812/ChatGLM-chinese-insturct

27182812 avatar Mar 24 '23 07:03 27182812

数据集是Alpaca-zh?

欢迎同学的LoRA提PR 👏🏻 :https://github.com/mymusise/ChatGLM-Tuning#lora

mymusise avatar Mar 25 '23 13:03 mymusise

给的例子里面三原色都不对了,另外很多重复的话

wanghia avatar Mar 27 '23 08:03 wanghia

我自己试的时候,好像重复的话不多,是不是参数的问题,不过比原始的ChatGLM-6B相比回复会变短。

27182812 avatar Mar 27 '23 08:03 27182812

大佬们都微调了多久,我微调后全是重复的语句

980202006 avatar Mar 30 '23 06:03 980202006

大佬们都微调了多久,我微调后全是重复的语句

我微调后都是空。。。

MichaelToLearn avatar Mar 31 '23 02:03 MichaelToLearn

大佬们都微调了多久,我微调后全是重复的语句

我微调后都是空。。。

怎么解决的?我也出现空

kevinuserdd avatar Apr 20 '23 06:04 kevinuserdd

大佬们都微调了多久,我微调后全是重复的语句

我微调后都是空。。。

怎么解决的?我也出现空

同样的问题,预测内容全是空

note-lh avatar Apr 22 '23 01:04 note-lh

大佬们都微调了多久,我微调后全是重复的语句

我微调后都是空。。。

怎么解决的?我也出现空

同样的问题,预测内容全是空

是因为推理时候的设置,do_sample,还有和你训练长度有关

kevinuserdd avatar Apr 26 '23 11:04 kevinuserdd

https://github.com/27182812/ChatGLM-chinese-insturct

我自己写的代码在这个数据集上alpaca_gpt4_data_zh.json 通过lora训练后,也是进入了复读机的模式,训练的数据越多,也会进入这样的情况

xiaoyichao avatar May 02 '23 10:05 xiaoyichao

复读机的情况,可以调一下预测的生成参数,增加随机性

shixiaoyangaaa avatar Jun 07 '23 10:06 shixiaoyangaaa

复读机的情况,可以调一下预测的生成参数,增加随机性

你好,我现在也遇到了复读机情况,能说得具体些吗?调整哪些参数,do_sample 和 temperature?

Daniel-1997 avatar Jun 08 '23 07:06 Daniel-1997

大佬们都微调了多久,我微调后全是重复的语句

我微调后都是空。。。

怎么解决的?我也出现空

同样的问题,预测内容全是空

是因为推理时候的设置,do_sample,还有和你训练长度有关

你好 请问具体是什么意思呢。do_sample应该设置为False?训练长度方面需要考虑什么呢?

xinj7 avatar Jun 09 '23 16:06 xinj7

增加随机性,一般就不会复读机,集束或者dosample都试一下

---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2023年06月10日 00:06 | | 收件人 | @.> | | 抄送至 | @.>@.> | | 主题 | Re: [mymusise/ChatGLM-Tuning] 试了下中文instrcut数据微调,效果好像还行 (Issue #70) |

大佬们都微调了多久,我微调后全是重复的语句

我微调后都是空。。。

怎么解决的?我也出现空

同样的问题,预测内容全是空

是因为推理时候的设置,do_sample,还有和你训练长度有关

你好 请问具体是什么意思呢。do_sample应该设置为False?训练长度方面需要考虑什么呢?

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

shixiaoyangaaa avatar Jun 09 '23 16:06 shixiaoyangaaa

你可以看一下,t设到0,就很容易复读机

---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2023年06月08日 15:00 | | 收件人 | @.> | | 抄送至 | @.>@.> | | 主题 | Re: [mymusise/ChatGLM-Tuning] 试了下中文instrcut数据微调,效果好像还行 (Issue #70) |

复读机的情况,可以调一下预测的生成参数,增加随机性

你好,我现在也遇到了复读机情况,能说得具体些吗?调整哪些参数,do_sample 和 temperature?

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

shixiaoyangaaa avatar Jun 09 '23 16:06 shixiaoyangaaa