wangzhe

Results 9 comments of wangzhe

> qwen-agent大约5-10轮工具调用的场景下, function call表现差,请问具体是体现在哪方面:(1)输出的function call不合法,经常出现格式错误呢;(2)还是function选择错误、参数错误;(3)还是不调用工具了;(4)或者过于高频调用工具? 几个比较典型的问题(按照必现频率排序): 1. FunctionCall JSON 格式异常,2. Function Call 时开始随机幻想,调用工具时,工具参数或者名称开始随机错误,3. 不主动调用工具,而是仅仅通过语义描述操作步骤。

> 你是啥使用场景?介绍一下 我们的场景是用于业务自动化用例的生成和修复场景,例如,我们会提供一些文件(函数)的修改&查询工具、测试用例执行工具、部分Shell操作工具,当自动化用例(例如pytest)生成后执行失败等场景下,向测试工程师一样自动分析&调试&修复问题。

> 另外,dahsscope针对多轮做了些trade off,需要的话我在qwen-agnet完善下也可以。。但我现在比较缺多轮的评测集来反映这方面的情况,欢迎社区提供多轮的badcases Cool,这块我这儿可以提供一些多轮的 BadCase~看一下怎么提供比较好?

同求尽快上线到模型平台提供付费 API 推理服务~ 72B DPO 模型效果是真的好,但是 72B 模型独立部署成本实在太高了~

https://github.com/microsoft/playwright/blob/bd5a23f88f3c54b6fd15ff1cde0693babfc86285/packages/protocol/src/channels.d.ts#L2095 The JS version of Playwright provides a snapshotForAI method, which converts a Page into a snapshot format. In this format, each page element is assigned a ref-id, enabling models...

Or exposing the forAI parameter in the ariaSnapshot method in the Node version would also work. Attached is the ariaSnapshot definition from Node version 1.53: ```yaml ariaSnapshot: title: Aria snapshot...

The Python Playwright 1.53.0 has been released. Can the for_ai parameter be added to the aria_snapshot method now?