MiniCPM-o icon indicating copy to clipboard operation
MiniCPM-o copied to clipboard

[BUG] <title> finetune/dataset.py 有bug

Open bingo-todd opened this issue 4 months ago • 6 comments

多图微调训练,llm_type=minicpm,报错“data fetch error“。 调试后发现,finetune/dataset.py的conversation_to_ids函数有bug。 根据llm_type的不同,conversation_to_ids函数会分别调用conversation_to_ids_llama3、conversation_to_ids_qwen2、conversation_to_ids_minicpm。前两个函数返回的input_ids是numpy对象,而最后一个函数直接返回list。然而conversation_to_ids函数的第146行使用.shape的方式获取input_ids的大小,导致错误。

bingo-todd avatar Oct 28 '24 08:10 bingo-todd