DouZero
DouZero copied to clipboard
使用人类数据训练SL模型
请问如何使用人类数据训练SL模型?数据应是什么格式的?在哪里进行操作呢?
这个功能得自己写,类型你自己定,它源码没提供这种接口= =
涉及用户数据 所以这一部分都不开源 可以自己实现一遍不太难
涉及用户数据 所以这一部分都不开源 可以自己实现一遍不太难
为什么我试了你们给的sl的ckpt,从开始到结束,预测胜率一直是百分百胜出?即使输了也是百分百胜率= =