fastNLP
fastNLP copied to clipboard
Msra训练NER,报cuda 内存满了?
你好,我在用Msra数据训练NER任务时,batchsize=8时训练就报cuda内存错误,batchsize=4可正常训练,就是训练迭代次数特别多,使用四GPU2080显卡也是这样问题,分布训练也太慢了,想问下,Msra数据这么吃内存吗,有更好的办法解决没,求教?
你用BERT的么?如果是BERT的话还算正常。MSRA中印象中有sample长度达到了1000+,一般是把它按照逗号拆分成更短的句子,或者就删除这个句子。
好的,感谢感谢!