ms-swift icon indicating copy to clipboard operation
ms-swift copied to clipboard

intervl 微调后lora合并推理和直接用原来demo推理结果不一致

Open fujianhai opened this issue 1 year ago • 4 comments

  1. internlvl2.0 swift微调后,然后采用lora merged , swift python 推理代码结果正常。

  2. 用原来推理demo, 推理,结果对不上,代码如下:

model = AutoModel.from_pretrained(
    path,
    torch_dtype=torch.bfloat16,
    load_in_8bit=True,
    low_cpu_mem_usage=True,
    trust_remote_code=True,
    device_map=device_map).eval()
    
generation_config = dict(
    num_beams=1,
    max_new_tokens=2048,
    do_sample=True,
)

fujianhai avatar Jul 23 '24 03:07 fujianhai

do_sample=False 不然有随机性

cyj95 avatar Jul 23 '24 10:07 cyj95

do_sample=False 不然有随机性 修改过了,但是还是不一致

fujianhai avatar Jul 23 '24 10:07 fujianhai

同上,测试lora权重得到的结果,只有一半字符,但是用merged lora后的权重测试,结果是对的。 比如答案是中国,前者只输出一个中就没了,后者输出中国。

leedewdew avatar Aug 05 '24 07:08 leedewdew

是不是max_new_tokens的设置问题

Jintao-Huang avatar Aug 05 '24 08:08 Jintao-Huang

是不是max_new_tokens的设置问题

应该不是,因为输出tokens很短,只有10个字符以内。

leedewdew avatar Oct 30 '24 06:10 leedewdew

设置一下model.generation_config.max_new_tokens=2048 试试

Jintao-Huang avatar Oct 30 '24 07:10 Jintao-Huang