MobileAgent icon indicating copy to clipboard operation
MobileAgent copied to clipboard

请教大佬,PC-Agent中gpt-4o进行对话的部分,能否换成本地部署的Qwen-VL-Chat?

Open shenyugub opened this issue 1 year ago • 7 comments

image 图片中标注的那部分能够换成千问

shenyugub avatar Oct 09 '24 08:10 shenyugub

可以替换,但是要考虑到被替换的模型是否足以作为Agent,建议选择闭源的、规模较大的模型。

junyangwang0410 avatar Oct 10 '24 01:10 junyangwang0410

可以替换,但是要考虑到被替换的模型是否足以作为Agent,建议选择闭源的、规模较大的模型。

我目前想换Qwen-VL-Chat,如果替换的话,关于gpt-4o的API接口相关的参数都有哪些详细的解释吗?具体的数据格式有什么特别的要求?

shenyugub avatar Oct 10 '24 06:10 shenyugub

可以替换,但是要考虑到被替换的模型是否足以作为Agent,建议选择闭源的、规模较大的模型。

我目前想换Qwen-VL-Chat,如果替换的话,关于gpt-4o的API接口相关的参数都有哪些详细的解释吗?具体的数据格式有什么特别的要求?

Qwen-VL目前支持兼容OpenAI的格式,可以参考通义千问的API文档:https://help.aliyun.com/zh/dashscope/developer-reference/tongyi-qianwen-vl-plus-api#6194b12252urk

junyangwang0410 avatar Oct 15 '24 07:10 junyangwang0410

@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右?这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗

lonngxiang avatar Nov 07 '24 07:11 lonngxiang

@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右?这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗

Qwen-VL也可以用API方式,4o只能用API方式

junyangwang0410 avatar Nov 07 '24 07:11 junyangwang0410

@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右?这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗

Qwen-VL也可以用API方式,4o只能用API方式

两者分别的作用是?

lonngxiang avatar Nov 07 '24 07:11 lonngxiang

@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右?这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗

Qwen-VL也可以用API方式,4o只能用API方式

两者分别的作用是?

qwen-vl用于细粒度感知图标,4o用于决策

junyangwang0410 avatar Nov 07 '24 12:11 junyangwang0410