zjutnlper
怎么使用中文数据集,我把预训练换成中文的bert,但训练的时候batch_size=1都会爆显存
不知道为啥一直在89.5差不多,根本达不到论文的92,请问是环境问题还是啥,请大哥们解答
是不给了嘛
我想问一下,三仿射模块维度设置多少合理,我设128维度就报显存了,显存大小是24g