syspider

Results 2 comments of syspider

生成的时候可以使用past_key_values机制加速。博主生成的时候每一次输入都是整个序列,改进后能快不少

他复用了GPT2LMHeadModel这个类里的loss,这里面计算loss的时候已经错位了,你可以看源码