MobileAgent 请教大佬，PC-Agent中gpt-4o进行对话的部分，能否换成本地部署的Qwen-VL-Chat？

请教大佬，PC-Agent中gpt-4o进行对话的部分，能否换成本地部署的Qwen-VL-Chat？

Open shenyugub opened this issue 1 year ago • 7 comments

图片中标注的那部分能够换成千问

Oct 09 '24 08:10 shenyugub

可以替换，但是要考虑到被替换的模型是否足以作为Agent，建议选择闭源的、规模较大的模型。

Oct 10 '24 01:10 junyangwang0410

可以替换，但是要考虑到被替换的模型是否足以作为Agent，建议选择闭源的、规模较大的模型。

我目前想换Qwen-VL-Chat，如果替换的话，关于gpt-4o的API接口相关的参数都有哪些详细的解释吗？具体的数据格式有什么特别的要求？

Oct 10 '24 06:10 shenyugub

可以替换，但是要考虑到被替换的模型是否足以作为Agent，建议选择闭源的、规模较大的模型。

我目前想换Qwen-VL-Chat，如果替换的话，关于gpt-4o的API接口相关的参数都有哪些详细的解释吗？具体的数据格式有什么特别的要求？

Qwen-VL目前支持兼容OpenAI的格式，可以参考通义千问的API文档：https://help.aliyun.com/zh/dashscope/developer-reference/tongyi-qianwen-vl-plus-api#6194b12252urk

Oct 15 '24 07:10 junyangwang0410

@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右？这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗

Nov 07 '24 07:11 lonngxiang

@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右？这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗

Qwen-VL也可以用API方式，4o只能用API方式

Nov 07 '24 07:11 junyangwang0410

@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右？这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗

Qwen-VL也可以用API方式，4o只能用API方式

两者分别的作用是？

Nov 07 '24 07:11 lonngxiang

@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右？这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗

Qwen-VL也可以用API方式，4o只能用API方式

两者分别的作用是？

qwen-vl用于细粒度感知图标，4o用于决策

Nov 07 '24 12:11 junyangwang0410