v1_2多图微调问题
非常厉害的模型,我这边主要有两个问题想要请教下:
1.第一个问题就是标题中的问题,1.2版本是否支持多图输入的微调呢?具体而言,在第一轮对话中给出多张图像及问答对的微调形式是否可行呢?大概是这个意思:
{
"id": 0,
"image": "images/5.png","images/6.png","images/7.png",
"conversations": [
{
"from": "human",
"value": "
我也面临同样的问题,请问是否可以帮忙解答
现在建议去微调InternVL2的模型。
多图可以按照这个格式准备数据:https://internvl.readthedocs.io/en/latest/get_started/chat_data_format.html#multi-image-data
然后按照这个文档进行微调:https://internvl.readthedocs.io/en/latest/internvl2.0/finetune.html