AgentBench icon indicating copy to clipboard operation
AgentBench copied to clipboard

[Assistance] OS task retrun infos

Open xiaxiaxiatengxi opened this issue 1 year ago • 1 comments

Describe the bug 我看我们的OS环境目前是以用docker的方式把环境进行打包,之后利用Python的Docker.py和os环境交互。 想问一下,我们的OS环境,有相关的操作说明吗? 就类似RL的环境 每一步都有哪些可执行操作、环境会有的反馈以及每一次的reward,我想单独把OS交互的代码拿出来,之后适配到我们自己的任务里……

xiaxiaxiatengxi avatar Nov 19 '24 11:11 xiaxiaxiatengxi

我们没有额外规定动作空间,模型相当于就是对着一个bash想输入什么输入什么,bash返回了什么我们就给模型看什么,因此也没有每一个步骤的reward,只有最后checking script返回对错与否可以当做最终的reward。

zhc7 avatar Dec 06 '24 02:12 zhc7