MNN icon indicating copy to clipboard operation
MNN copied to clipboard

推理结果较长数据后,后面全是重复内容无法停止

Open jianking123 opened this issue 9 months ago • 19 comments

模型版本为Qwen2.5-0.5B-instruct-MNN Image Image Image

jianking123 avatar Mar 12 '25 01:03 jianking123

请问是问题吗

jianking123 avatar Mar 15 '25 02:03 jianking123

0.5B model is too small

huangzhengxiang avatar Mar 17 '25 14:03 huangzhengxiang

0.5B model is too small

我又尝试了Qwen2.5-1.5B-instruct-MNN模型,也有同样的问题 两个模型的效果是可以接受的因为加载和推理速度都可以,请问这个问题可以解决吗

jianking123 avatar Mar 18 '25 00:03 jianking123

0.5B model is too small

我又尝试了Qwen2.5-1.5B-instruct-MNN模型,也有同样的问题 两个模型的效果是可以接受的因为加载和推理速度都可以,请问这个问题可以解决吗

可以解决,等我们发布最新版本

v0jiuqi avatar Mar 18 '25 01:03 v0jiuqi

0.5B model is too small

我又尝试了Qwen2.5-1.5B-instruct-MNN模型,也有同样的问题 两个模型的效果是可以接受的因为加载和推理速度都可以,请问这个问题可以解决吗

可以解决,等我们发布最新版本

when will this version lunched ? or could you tell me how to avoid this problem

RealTimeAndMoney avatar Mar 18 '25 02:03 RealTimeAndMoney

0.5B model is too small

我又尝试了Qwen2.5-1.5B-instruct-MNN模型,也有同样的问题 两个模型的效果是可以接受的因为加载和推理速度都可以,请问这个问题可以解决吗

可以解决,等我们发布最新版本

when will this version lunched ? or could you tell me how to avoid this problem

Today we will release a new version.

v0jiuqi avatar Mar 18 '25 02:03 v0jiuqi

默认的采样方式没有规避重复的处理,可以在 config.json 里面加一句 "sampler_type": "penalty"

https://mnn-docs.readthedocs.io/en/latest/transformers/llm.html

jxt1234 avatar Mar 19 '25 03:03 jxt1234

请问已经发布新版本了吗? 我看modelscope 和huggingface上 还是 24 年 12 月 31 更新的

rhythmcity avatar Mar 26 '25 02:03 rhythmcity

这个和模型无关,更新 mnn 代码即可

jxt1234 avatar Mar 27 '25 03:03 jxt1234

这个和模型无关,更新 mnn 代码即可

请问都更新哪里的代码,没有看到此问题的pull和新的releases

jianking123 avatar Mar 27 '25 03:03 jianking123

这个和模型无关,更新 mnn 代码即可

我是用 iOS 的 app, 请问这个是更新哪部分的代码, 我当前使用的是 3 月 21 日的 master 分支,这个后面是有针对这个问题修复吗?

rhythmcity avatar Mar 27 '25 06:03 rhythmcity

请问这个更新是否需要更换so文件,如果需要去哪里下载

jianking123 avatar Mar 29 '25 01:03 jianking123

这个和模型无关,更新 mnn 代码即可

请问更新那部分

jianking123 avatar Apr 09 '25 05:04 jianking123

默认的采样方式没有规避重复的处理,可以在 config.json 里面加一句 "sampler_type": "penalty"

https://mnn-docs.readthedocs.io/en/latest/transformers/llm.html

您好,我已经设置了sampler_type,也使用了目前最新的代码编译,还是出现重复无法停止的问题,请问是目前还没有办法修复吗,希望您能回复一下

jianking123 avatar May 24 '25 02:05 jianking123

你好,请问这个问题有解决吗?

Jayden-cn avatar May 26 '25 09:05 Jayden-cn

用最新代码 设置 sampler penalty 即可

Juude avatar May 26 '25 12:05 Juude

用最新代码 设置 sampler penalty 即可 你好,请问我已经修改了以下配置,但是结果还是重复,最后配置的时候是根据模型设置页面走吗,但是config.json和模型页面配置都修改了还是有这问题,请问是我修改的不对吗

Image Image Image

jianking123 avatar May 27 '25 00:05 jianking123

可以吧 penalty 的值设置的大一些。 或者使用 mixed 模式试试

Juude avatar May 27 '25 03:05 Juude

可以吧 penalty 的值设置的大一些。 或者使用 mixed 模式试试

感谢回复,把penalty 的值设置的大之后会出现下面的问题,但是使用 mixed 模式有效果,我会使用mixed 模式,谢谢

Image

jianking123 avatar May 27 '25 03:05 jianking123

Marking as stale. No activity in 60 days.

github-actions[bot] avatar Jul 26 '25 09:07 github-actions[bot]