MobileAgent icon indicating copy to clipboard operation
MobileAgent copied to clipboard

Mobile-Agent: The Powerful GUI Agent Family

Results 157 MobileAgent issues
Sort by recently updated
recently updated
newest added

我对mobile-agent-v的使用有疑问,我在真实场景中使用,比如执行一个点外卖指令。我哪里来的完整的点外卖视频,这不是包含未来信息吗。即使可以从网上找到其他点外卖的视频,但是如果是不同app呢?我在美团点外卖,但是网上视频是饿了么?用饿了么作为guidance来指挥agent点美团外卖可行吗

执行这段代码以后bash scripts/run_task.sh。。。下载了大模型文件(我用手机流量下载的😭😭),之后显示找不到某个文件 ![Image](https://github.com/user-attachments/assets/c96e45cf-5564-4f28-aa91-48b12ebec91e)

不是,哥们,就等这个呢,外网gemini,openAi,claude谁敢用啊,基于开源模型,显存才8G,这么牛逼,不开源啊

运行run.py卡住了,截图如下: ![Image](https://github.com/user-attachments/assets/300f5f91-c661-4bc5-a75c-e211a018472c)

有计划开源pc_eval 的数据集吗

我要启动的app不在当前屏幕,工具会一值陷入上下滑动的循环操作,我在add_info里加入描述让他找不到应用时左右滑动,但是没起作用。这是一部分log: ### Answer ### C ################################################################################################################ ################################################## Decision ################################################## ### Thought ### The Bilibili app is not visible on the current screen. I need to swipe to the next page...

你好,我尝试了很多次,时不时会出现这种情况: ### Perceptor ... ### 2025-03-07 16:39:45,211 - modelscope - WARNING - task grounding-dino-task input definition is missing FutureWarning: The `device` argument is deprecated and will be removed in v5...

我们是通过Azure的api调用gpt,相关的key能直接用到咱们项目里吗

这个reflection能力我觉得有三点: 1. 能意识到任务是否完成 2. 能意识到需要做撤销/回退 3. 如果是视觉设计的任务,还要能感知到设计出来的东西是否违反人类审美 这三点对于MLLM来说,一个比一个难,我们测试过PPT编辑类任务,对于复杂点的PPT编辑,几乎很少有正确的Reflection