Results 12 comments of Xavier

> 俺也没有🥲

把学习率降低试试。 建议别用GRU了,效果很差(或者你增加一下GRU的复杂度,然后重新训练)。 直接用预训练模型+微调是更好的选择。

> 是要先新建两个空的pkl文件然后在运行吗?运行了那个288行显示ran out of input怎么回事呀 依次执行 python go.py -p python go.py -b python go.py -m 试试看吧,时间太久我也记不清了😂

> 请问GRU的训练和微调的关系,是不是可以不训练GRU直接微调呢? 是的

> 生成的结果有很多unk怎么回事啊?怎么改啊 应该是模型复杂度太低了😤 当时因为deadline快到了,直接去用预训练模型没再改GRU了😩 要不你把GRU改改看看怎么样😉

你把batch size 调成1试试

没实现这个,只对每个epoch的训练结果做了保存。你可以自己实现一下

bartembedding最大只支持到1024。使用预训练模型bart时,settings.py 中SOURCE_THRESHOLD不能超过1024