Asia-king

Results 2 comments of Asia-king

@lc222 batch_size他原来是512,我降到256,把输入输出的长度以增加,他还是会爆掉,是不是因为这个模型中的attention机制造成的?

@lc222 应该不是机器性能的问题,我用的是32G内存的服务器,应该是其他代码的问题吧