sxu1997

Results 2 comments of sxu1997

请教一下~尽管论文中解释了GPT4V缺乏定位能力,但是给定icon的描述,GPT4V不具备给出坐标的能力吗?GDINO的存在是必要的吗?

> > 请教一下~尽管论文中解释了GPT4V缺乏定位能力,但是给定icon的描述,GPT4V不具备给出坐标的能力吗?GDINO的存在是必要的吗? > > 我们尝试过让GPT-4V根据icon描述给出对应的坐标,但是发现GPT-4V不具备这个能力,换句话说,GPT-4V只具备感知能力,不具备定位能力。希望能帮助到你。 Thanks for reply. 未来有针对这个问题的更新计划吗(定位不使用单独的模块,而是整个模型端到端)?