tuxchow

Results 3 comments of tuxchow

从运行结果来看,各种情绪生成的回复没有区分度,可能是引入情绪信息的部分出了 bug

NLPCC2017 是过滤后的小数据集,其训练数据中每个 post 平均对应2-3种不同情绪的 response,所以对于未训练到的情绪种类的 response 其生成质量并不高。在比赛评测时,也只测试其中概率较高的几种情绪类别的 response。 对于不同模块组会的性能,可以通过调整模型训练参数进行调整,在 ESTC 的数据集上的实验结果是,加入 ememory 后会提升情绪表达的准确率,详情可以参考论文。

这块代码看起来很奇怪,确实应该换一下比较合理: `create_vocabulary(response_vocab_path, [y[0] for x in train for y in x[1]], response_vocabulary_size, tokenizer)` `create_vocabulary(post_vocab_path, [x[0][0] for x in train], post_vocabulary_size, tokenizer)` 感谢指出这个bug,我会更新到代码中。