DeepSpeedExamples
DeepSpeedExamples copied to clipboard
how to train a unsupervised dataset?
Hi @janelu9, can you provide more details?
我发现强化学习部分的训练 有可以训练无监督数据是吗?它的原理是什么?根据当前片段的句子直接生成下一个片段的句子吗?
我发现强化学习部分的训练 有可以训练无监督数据是吗?它的原理是什么?根据当前片段的句子直接生成下一个片段的句子吗?
Yes, it is :) you just need the query/prompt part.
closed due to no followup for 2 weeks.
Yes, it is :) you just need the query/prompt part.
prompt 是 双向attention,answers是单向attention 无监督训练应该是用单向吧