MobileAgent
MobileAgent copied to clipboard
请教大佬,PC-Agent中gpt-4o进行对话的部分,能否换成本地部署的Qwen-VL-Chat?
图片中标注的那部分能够换成千问
可以替换,但是要考虑到被替换的模型是否足以作为Agent,建议选择闭源的、规模较大的模型。
可以替换,但是要考虑到被替换的模型是否足以作为Agent,建议选择闭源的、规模较大的模型。
我目前想换Qwen-VL-Chat,如果替换的话,关于gpt-4o的API接口相关的参数都有哪些详细的解释吗?具体的数据格式有什么特别的要求?
可以替换,但是要考虑到被替换的模型是否足以作为Agent,建议选择闭源的、规模较大的模型。
我目前想换Qwen-VL-Chat,如果替换的话,关于gpt-4o的API接口相关的参数都有哪些详细的解释吗?具体的数据格式有什么特别的要求?
Qwen-VL目前支持兼容OpenAI的格式,可以参考通义千问的API文档:https://help.aliyun.com/zh/dashscope/developer-reference/tongyi-qianwen-vl-plus-api#6194b12252urk
@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右?这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗
@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右?这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗
Qwen-VL也可以用API方式,4o只能用API方式
@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右?这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗
Qwen-VL也可以用API方式,4o只能用API方式
两者分别的作用是?
@junyangwang0410 这里 qwen-vl模型 Load caption model 与 gpt4-o两个模型的分别左右?这里qwen-vl用的本地模型、 gpt4-o用的api调用是吗
Qwen-VL也可以用API方式,4o只能用API方式
两者分别的作用是?
qwen-vl用于细粒度感知图标,4o用于决策