Results 57 comments of

2、3、4的太大了,我的batch_size是一个一个跑的,看的是他们的前几个的loss

链接的是按照原论文那种,没有改动的

> * 训练时间太长 Case1 没跑完:算力已补充 > * 评价指标不明确:loss和torch对齐 > * 额外需要注意case4:可视化代码需要完成 可视化代码尚未补上