shtdbb
Results
2
issues of
shtdbb
想计算一下一个例子的 loss,发现 hf 里的 modeling_chatglm.py 代码里 `ChatGLMForConditionalGeneration` 类 `foeward()` 方法可以输入 `labels` 计算 loss。想问问这个 `labels` 是什么类型呀?是期望输出的字符串的 ids,还是 word embedding 呢?需要有什么特殊填充格式构造 `labels` 吗?谢谢!
关于解决 #464 的修改。 避免困难样本挖掘时,当召回负样本数量少于预设负采样数量,会随机采样到正样本、或重复采样负样本的问题。 修改为,默认从 `corpus` 中剔除正例和已召回的负例,再进行随机采样;若剔除后 `corpus` 为空,说明需要重复采样负样本才能满足负采样数量要求,则只剔除正样本、重复采样负样本即可。