xalss comments

Results 10 comments of


                                            xalss

关于模型结构和 kw_mask

> 你好，我想请问下你跑出来的数据格式是怎么样的？然后输入数据是怎么样的？你的关键词用的是源代码提供的方法吗？ > 使源代码产生的数据是prediction[0.5555，0.4445]，类似这种格式，他代表了什么？如果prediction[0]代表标签为0的概率，如果prediction[1]代表标签为1的概率，但是源代码跑出来的数据都是prediction[0]>prediction[1],那模型预测均为0，是为什么那？我并没有使用这个 repo 的代码，关键词我用的百度的 LAC 提取的

DIN输入历史行为序列不定长问题

现在可以支持batch内最大长度吗，maxlen设置为None可以吗

新增对Valine评论系统的支持

请问各位，我的评论系统也在主页出现了，确定代码位置什么的都没放错，实在不知道问题出在哪里

新增对Valine评论系统的支持

@saranfeishuang 多谢啦，还是我太菜了，你这么一说感觉恍然大悟

新增对Valine评论系统的支持

@saranfeishuang 我就是用了\，没其他的了

新增对Valine评论系统的支持

@saranfeishuang 客气了

请发布一个小参数版本的ChatGLM，与ChatGLM-6B共享Tokenizer，让RLHF最后一步PPO能够最大可能提速

Reward Model 的tokenizer可以和actor不保持一致吧

vllm 72b启动失败

多卡可能要加这个参数 --tensor-parallel-size，我用了没报oom的错了，但是有其他cuda错误

请教一下，指令微调baichuan13，训练后期出现重复\n问题

> 我把连续的换行符换成单个后，还是有这个问题。但是同样的超参数微调了baichuan7b和llama-cuiyiming没有这个问题。之后把embed和lm_head冻结后就没这个问题了，或者不冻结混入一些开源数据也可以

EMA的全称是什么

> 感谢分享，请问这里的`EMA`的全称是什么呢 > > ![image](https://user-images.githubusercontent.com/1934999/107344848-e53a3780-6afd-11eb-8861-32c0e96ec989.png) 指数滑动平均 (Exponential Moving Average)