BARTNER 替换为中文的fnlp/bart-large-chinese 模型后，如何改动代码，能让bart训练中文？请问有训练成功过吗

替换为中文的fnlp/bart-large-chinese 模型后，如何改动代码，能让bart训练中文？请问有训练成功过吗

Open aixiaoxin123 opened this issue 2 years ago • 7 comments

请问替换为中文的fnlp/bart-large-chinese 模型后，如何改动代码，能让bart训练中文？请问有训练成功过吗？

May 12 '22 05:05 aixiaoxin123

fnlp/bart-large-chinese用的是BertTokenizer，所以下面这里应该是需要删掉add_prefix_space=True这个 https://github.com/yhcc/BARTNER/blob/b1741fec4d1696b5712f5d60b3ee1318bd8d05c9/data/pipe.py#L113
好像是就没有需要改动了，之前我有尝试过使用中文bart跑flat ner，但是效果比bert会差一些，主要原因是由于好像生成式的方式在中文里面会比较难找对boundary，但是我也没咋调参，不确定如果修改一些参数会不会让效果好一些。