xalss
xalss
> 你好,我想请问下你跑出来的数据格式是怎么样的?然后输入数据是怎么样的?你的关键词用的是源代码提供的方法吗? > 使源代码产生的数据是prediction[0.5555,0.4445],类似这种格式,他代表了什么?如果prediction[0]代表标签为0的概率,如果prediction[1]代表标签为1的概率,但是源代码跑出来的数据都是prediction[0]>prediction[1],那模型预测均为0,是为什么那? 我并没有使用这个 repo 的代码,关键词我用的百度的 LAC 提取的
现在可以支持batch内最大长度吗,maxlen设置为None可以吗
请问各位,我的评论系统也在主页出现了,确定代码位置什么的都没放错,实在不知道问题出在哪里
@saranfeishuang 多谢啦,还是我太菜了,你这么一说感觉恍然大悟
@saranfeishuang 我就是用了\,没其他的了
@saranfeishuang 客气了
Reward Model 的tokenizer可以和actor不保持一致吧
多卡可能要加这个参数 --tensor-parallel-size,我用了没报oom的错了,但是有其他cuda错误
> 我把连续的换行符换成单个后,还是有这个问题。但是同样的超参数微调了baichuan7b和llama-cuiyiming没有这个问题。之后把embed和lm_head冻结后就没这个问题了,或者不冻结混入一些开源数据也可以
> 感谢分享,请问这里的`EMA`的全称是什么呢 > >  指数滑动平均 (Exponential Moving Average)