Bert-Chinese-Text-Classification-Pytorch
Bert-Chinese-Text-Classification-Pytorch copied to clipboard
改用自己的数据集,训练效果问题
数据格式是这种短句
下面这个是属于什么问题呢,改怎么改呢?用的bert模型,没有修改参数
1.训练集有没有打乱?看你图片上的数据标签全0 2.models/对应的py文件里面self.pad_size自己改一下,即每个短句处理后的长度,用你数据集的平均长度就好
1.训练集有没有打乱?看你图片上的数据标签全0 2.models/对应的py文件里面self.pad_size自己改一下,即每个短句处理后的长度,用你数据集的平均长度就好
你好,我的数据集是这种的{"label": "108", "label_desc": "news_edu", "sentence": "上课时学生手机响个不停,老师一怒之下把手机摔了,家长拿发票让老师赔,大家怎么看待这种事?", "keywords": ""} 我已经把代码改过了,数据的读入都没问题,训练集也都是乱序的,但是训练结果只有50%,请问正常吗,正常的话怎么改可以提高训练结果,不正常的话可能是哪里出了问题
BERT这种在小数据集上一下子就过拟合了
你这个数据集是自己写的还是通过代码实现的