machine-translation-seq2seq-pytorch
machine-translation-seq2seq-pytorch copied to clipboard
数据中一些小情况
trafficstars
作者您好,我学习您代码的过程中,在运行encode部分时候发现了一个小问题,就是从您代码提供的连接下载的数据中,有一些行在英文文本中是空行,但是在中文文本中却有对应的翻译,比如英文文本的4087行,8112行这样,如果作者您手上的文本没有这种情况的话是否介意将您手上的数据转发给我一份吗,或者您手上的数据也是这样的话后面是不是还有其他针对性的操作呢
作者您好,我学习您代码的过程中,在运行encode部分时候发现了一个小问题,就是从您代码提供的连接下载的数据中,有一些行在英文文本中是空行,但是在中文文本中却有对应的翻译,比如英文文本的4087行,8112行这样,如果作者您手上的文本没有这种情况的话是否介意将您手上的数据转发给我一份吗,或者您手上的数据也是这样的话后面是不是还有其他针对性的操作呢
您好,我主要是为了复现算法。我自己从该数据集中手动抽取了一部分中英文一一匹配的数据(大概1w行左右),训练效果一般。你要是想训练一个更好的模型,可以找一下其他数据集。