Tough-Stone

Results 14 comments of Tough-Stone

谢谢回答。那么这个任务在训练时的目标就是从原句子中抽取部分,再恢复到原句吗

谢谢,我现在还有两个问题: 在构建合成数据时,encoder label是利用什么策略获得的? 如果在推理阶段用较少的关键词想要生成更长的句子,应该做哪些修改呢?我尝试了一些别的测试用例,关键词与关键词之间几乎没有插入新单词,而是全部插入到了句子的结尾。

如果使用中文,每个关键词都不止一个token,在推理时indicate_labels中间有很多0,最终插入的新单词全跑到了句尾,这个是什么原因呢

好的。那么训练时为什么要定义成3分类而不是2分类呢,如果推理阶段只需要插入新词的话,为什么需要替换操作。我看到构造合成数据时,专门构造了一些只含有替换操作的数据(比如create_replaced_samples)