zjutnlper comments

Results 20 comments of


                                            zjutnlper

Chinese field

> 我改了源代码你说的差是有多差我目前测出来中文的f1在71左右你好，想搞中文的要怎么整，只要换个预训练吗，我换个直接爆显存了

Chinese field

> > 我改了源代码你说的差是有多差我目前测出来中文的f1在71左右 > > 可以给我看看你改的源码嘛，你好，想用自己的中文数据集应该怎么改源码呢，我就换了个预训练，效果特别差

Chinese field

> 主要是tokenizer部分那块怎么了吗，源码就调用了huggingface那个接口，没看出啥不合理，请指教大佬

Chinese field

> 太久远了记不大清楚了英文的token跟中文的token不同你直接换模型 bert-large肯定适配不了很好的chinese啊每个模型有他自己的vocabulary 我是换了预训练模型的，bert-Chinese这个，效果确实不好

Chinese field

> 我的意思不是模型不好是每个模型的tokenizer就不一样他的源码是英文的编码逻辑你现在换中文的肯定不行的你得把tokenizer换成是中文的那种分词逻辑才行的大佬，那该怎么改，无经验

求助中文

> self.train_batch_size = 1 if 'WebNLG' in corpus_type else 4 > > 要改后面那个数字，前面的数字只能修改WebNLG的batchsize 你好，请问中文数据集这块，换个预训练就就可以了吗，那个batch我解决了，但实际训练的时候非常差效果。还有我设置100个epoch，他却20个就停止了。

> > > self.train_batch_size = 1 if 'WebNLG' in corpus_type else 4 > > > 要改后面那个数字，前面的数字只能修改WebNLG的batchsize > > > > > > 你好，请问中文数据集这块，换个预训练就就可以了吗，那个batch我解决了，但实际训练的时候非常差效果。还有我设置100个epoch，他却20个就停止了。 > > 你好，请问你解决中文训练的问题了吗，我把BERT换成了中文，但是F1全是0，是跟参数有关吗你好，具体我也不清楚，英语分词和中文分词逻辑不太一样，我训练出来的效果很差

F1,recall和准确率都是0

用的是大佬给的百度数据

F1,recall和准确率都是0

> > 用的是大佬给的百度数据 > > 你好请问解决了吗，我现在也遇到了这个问题就是训练次数太少了，到了某个epoch就会上涨