Bert-Chinese-Text-Classification-Pytorch icon indicating copy to clipboard operation
Bert-Chinese-Text-Classification-Pytorch copied to clipboard

改用自己的数据集,训练效果问题

Open cfy42584125 opened this issue 3 years ago • 4 comments

数据格式是这种短句 image 下面这个是属于什么问题呢,改怎么改呢?用的bert模型,没有修改参数 image

cfy42584125 avatar Jul 02 '21 01:07 cfy42584125

1.训练集有没有打乱?看你图片上的数据标签全0 2.models/对应的py文件里面self.pad_size自己改一下,即每个短句处理后的长度,用你数据集的平均长度就好

ghost avatar Jul 14 '21 14:07 ghost

1.训练集有没有打乱?看你图片上的数据标签全0 2.models/对应的py文件里面self.pad_size自己改一下,即每个短句处理后的长度,用你数据集的平均长度就好

你好,我的数据集是这种的{"label": "108", "label_desc": "news_edu", "sentence": "上课时学生手机响个不停,老师一怒之下把手机摔了,家长拿发票让老师赔,大家怎么看待这种事?", "keywords": ""} 我已经把代码改过了,数据的读入都没问题,训练集也都是乱序的,但是训练结果只有50%,请问正常吗,正常的话怎么改可以提高训练结果,不正常的话可能是哪里出了问题

mokems avatar Jul 30 '21 07:07 mokems

BERT这种在小数据集上一下子就过拟合了

ChasionNo1 avatar Sep 03 '21 07:09 ChasionNo1

你这个数据集是自己写的还是通过代码实现的

cc846049716 avatar Oct 07 '21 05:10 cc846049716