Jerry-155

Results 7 comments of Jerry-155

> 可以使用LM Studio 本地运行,参考:https://modelscope.cn/models/HHaoAI/UI-TARS-1.5-7B-GGUF可以使用 LM Studio 本地运行,参考: https://modelscope.cn/models/HHaoAI/UI-TARS-1.5-7B-GGUF @hhao 请问您这个gguf的版本可以对图片进行推理嘛,我之前试过llama.cpp的,只能t2t,不能i2t

![Image](https://github.com/user-attachments/assets/95eee5e6-9064-488d-8aca-6274d1df4bbf) @hhao 好像没找到这个模型

> 这里只能搜到 huggingface 上面的模型,我的模型在 modelscope,没有上传 HF > > 需要手动下载,放到LM Studio 的模型目录。 ![Image](https://github.com/user-attachments/assets/e4d281b9-a29e-44e5-baa4-8116b8048dba) @hhao 对不起我的问题可能有点多,感谢你的帮助我已经成功把模型下载本地,并完成推理,但是我似乎仍然无法针对图片进行处理,是我哪里设置的有问题 ![Image](https://github.com/user-attachments/assets/6d42c04c-50e4-47bb-be8d-4147f6337ff8) 之前没用过LM studio

> 需要把 mmproj-ui-tars-1.5-f16.gguf 文件和 q8_0.gguf 文件放在一起,就会出现那个支持视觉的眼睛👀 > > 另外,上下文长度要设置为:68000 @hhao 非常感谢您的帮助我现在已经通过LM studio 在本地成功的部署并运行了UI-TARS模型,并且把模型加载到了midscene中,但是现在出现了一个很严重的问题,就是本地模型和直接调用火山的API实际上模型输出坐标的精准度存在很大的问题,不知道您在实际运用中是否遇到过类似的问题

> 没有测试过midscene,用UI-TARS-Desktop( https://github.com/bytedance/UI-TARS-desktop/releases/tag/v0.1.0 )测试可以正常执行浏览器操作,Q8量化的可能有精度丢失,官方模型是float32,试试不同精度的效果。 @hhao ![Image](https://github.com/user-attachments/assets/471d6414-7816-47cd-9b7b-cbc8867cc897) 正如你所说的Q8的精度还是存在很大的问题的

> 使用最新的/UI-TARS-desktop-v0.1.0。 你们是怎么在本地部署这个模型的啊,大概需要多少显存

> > > 使用最新的/UI-TARS-desktop-v0.1.0。 > > > > > > 你们是怎么在本地部署这个模型的啊,大概需要多少显存 > > 至少20GB显存吧,要不就CPU部署 @woxima 具体如何部署有详细的部署参考嘛,十分感谢