evilwolf1979

Results 3 comments of evilwolf1979

> > 您使用什么模型进行部署? > > 本地资源不足以运行视觉模型,因此选择云端的模型的api: 使用的是千问视觉模型 qwen-vl-max-latest qwen-vl-max-1230 请问您部署使用的是UI-TARS还是Agent-TARS?还有一个问题就是说您部署的视觉模型占用GPU资源有多少呢?是否解决了坐标不准确的问题呢?

> 我试验了各种方法,也在本地V10卡+vllm部署测试了,依然是几乎必现的,验证指令(win):“在桌面上新建文本文档”。 同样的配置部署sft模型没有这个问题,dpo模型7b和72b都会出现输出异常: > > ![Image](https://github.com/user-attachments/assets/db89e397-35be-4648-97ec-41e700dec44f)能否提供一下您的vllm和cuda版本以及GPU型号,还有启动推理框架的详细参数? 您好,请问坐标偏移错乱的问题您解决了吗?我现在也是碰到这个问题很困扰我,现在推进不下去的。

> 我用的7B-DPO,效果还不错 请问你遇到鼠标点不中按钮的情况吗?一直点击按钮的旁边,进行不到下一步骤。请问您有解决方法吗?