evilwolf1979 comments

Results 3 comments of


                                            evilwolf1979

优化建议：将鼠标焦点移动到到目标图标的中间进行点击操作

> > 您使用什么模型进行部署？ > > 本地资源不足以运行视觉模型，因此选择云端的模型的api：使用的是千问视觉模型 qwen-vl-max-latest qwen-vl-max-1230 请问您部署使用的是UI-TARS还是Agent-TARS？还有一个问题就是说您部署的视觉模型占用GPU资源有多少呢？是否解决了坐标不准确的问题呢？

> 我试验了各种方法，也在本地V10卡+vllm部署测试了，依然是几乎必现的，验证指令（win）：“在桌面上新建文本文档”。同样的配置部署sft模型没有这个问题，dpo模型7b和72b都会出现输出异常： > > ![Image](https://github.com/user-attachments/assets/db89e397-35be-4648-97ec-41e700dec44f)能否提供一下您的vllm和cuda版本以及GPU型号，还有启动推理框架的详细参数？您好，请问坐标偏移错乱的问题您解决了吗？我现在也是碰到这个问题很困扰我，现在推进不下去的。

在window下基本用不了，识别错乱。。。

> 我用的7B-DPO，效果还不错请问你遇到鼠标点不中按钮的情况吗？一直点击按钮的旁边，进行不到下一步骤。请问您有解决方法吗？

evilwolf1979

优化建议：将鼠标焦点移动到到目标图标的中间进行点击操作

模型输出的坐标高概率错乱

在window下基本用不了，识别错乱。。。