Llama-Chinese icon indicating copy to clipboard operation
Llama-Chinese copied to clipboard

llama3 8B中文微调模型Llama3-Chinese-8B-Instruct 存在对生成的答案一直重复的问题

Open Ryan-0805 opened this issue 10 months ago • 9 comments

提问任何问题,都会一直重复自己的答案,直到达到模型的max_token;

Ryan-0805 avatar Apr 28 '24 02:04 Ryan-0805

遇到同样的bug

image

TimchaStudio avatar May 06 '24 07:05 TimchaStudio

我也遇到了同样的问题 image

Zhouxinyu668 avatar May 06 '24 07:05 Zhouxinyu668

作者不考虑回应一下吗?

Zhouxinyu668 avatar May 06 '24 08:05 Zhouxinyu668

image @TimchaStudio 这个是用哪个框架部署的?

hito0512 avatar May 08 '24 10:05 hito0512

@hito0512 chat.oaiui.com

这个问题还没有解决

TimchaStudio avatar May 10 '24 01:05 TimchaStudio

我尝试了一下,也存在这个问题

ZhichengQian1 avatar Jun 02 '24 06:06 ZhichengQian1

me too too~~

nbet avatar Jun 03 '24 01:06 nbet

大语言生成回答时一般会先生成一个开始符号类似于《start》然后输出正文,紧接着在结束时输出一个类似于《end》的特殊字符作为判断此句话结束。在这个具体问题里结束符用的可能是《\s》。出现这个问题可能是模型在训练中文语料库时更换了结束字符导致原来判断生成结束的符号失去作用。大伙可以自行添加判断生成结束的标识符可以解决这个问题。

3h2b avatar Jul 09 '24 09:07 3h2b

调整 temperature的大小,设置小于0.3以下。

chhaig avatar Aug 18 '24 13:08 chhaig