Bert-Chinese-Text-Classification-Pytorch 改用自己的数据集，训练效果问题

改用自己的数据集，训练效果问题

Open cfy42584125 opened this issue 4 years ago • 4 comments

数据格式是这种短句下面这个是属于什么问题呢，改怎么改呢？用的bert模型，没有修改参数

Jul 02 '21 01:07 cfy42584125

1.训练集有没有打乱？看你图片上的数据标签全0 2.models/对应的py文件里面self.pad_size自己改一下，即每个短句处理后的长度，用你数据集的平均长度就好

Jul 14 '21 14:07 ghost

1.训练集有没有打乱？看你图片上的数据标签全0 2.models/对应的py文件里面self.pad_size自己改一下，即每个短句处理后的长度，用你数据集的平均长度就好

你好，我的数据集是这种的{"label": "108", "label_desc": "news_edu", "sentence": "上课时学生手机响个不停，老师一怒之下把手机摔了，家长拿发票让老师赔，大家怎么看待这种事？", "keywords": ""} 我已经把代码改过了，数据的读入都没问题，训练集也都是乱序的，但是训练结果只有50%，请问正常吗，正常的话怎么改可以提高训练结果，不正常的话可能是哪里出了问题

Jul 30 '21 07:07 mokems

BERT这种在小数据集上一下子就过拟合了

Sep 03 '21 07:09 ChasionNo1

你这个数据集是自己写的还是通过代码实现的

Oct 07 '21 05:10 cc846049716

Bert-Chinese-Text-Classification-Pytorch Bert-Chinese-Text-Classification-Pytorch copied to clipboard

改用自己的数据集，训练效果问题

Bert-Chinese-Text-Classification-Pytorch
Bert-Chinese-Text-Classification-Pytorch copied to clipboard