Bert-Chinese-Text-Classification-Pytorch icon indicating copy to clipboard operation
Bert-Chinese-Text-Classification-Pytorch copied to clipboard

您好 我想问一下 为什么我按照源代码 原数据集训练出来的准确率 和你的差很多呢 而且时间也很长

Open ZMM6128 opened this issue 4 years ago • 10 comments

为什么我按照源代码 原数据集训练出来的准确率 和你的差很多呢 而且时间也很长

ZMM6128 avatar Jun 17 '20 11:06 ZMM6128

我也是bert跑出来准确率50左右

dovelz avatar Jun 18 '20 09:06 dovelz

为什么我按照源代码 原数据集训练出来的准确率 和你的差很多呢 而且时间也很长

我检查了下是词表出现了乱码,你可以看看bert里vocab.txt这个文件打开是不是正常的汉字,erine是正常的

dovelz avatar Jun 18 '20 16:06 dovelz

我也是bert跑出来准确率50左右

为什么我按照源代码 原数据集训练出来的准确率 和你的差很多呢 而且时间也很长

我检查了下是词表出现了乱码,你可以看看bert里vocab.txt这个文件打开是不是正常的汉字,erine是正常的

我看了一下 我bert里vocab.txt这个文件中的文字跟作者放的链接里面的是一样的 但是我觉得这个中文有点儿奇怪 image

ZMM6128 avatar Jun 19 '20 01:06 ZMM6128

我也是bert跑出来准确率50左右

我也是bert跑出来准确率50左右

那你把bert里的vocab.text改完之后 准去率提高了嘛

ZMM6128 avatar Jun 19 '20 01:06 ZMM6128

我也是bert跑出来准确率50左右

为什么我按照源代码 原数据集训练出来的准确率 和你的差很多呢 而且时间也很长

我检查了下是词表出现了乱码,你可以看看bert里vocab.txt这个文件打开是不是正常的汉字,erine是正常的

我看了一下 我bert里vocab.txt这个文件中的文字跟作者放的链接里面的是一样的 但是我觉得这个中文有点儿奇怪

找正常的词表改掉就行了,跑出来就是正常的了

dovelz avatar Jun 19 '20 02:06 dovelz

我也是bert跑出来准确率50左右

为什么我按照源代码 原数据集训练出来的准确率 和你的差很多呢 而且时间也很长

我检查了下是词表出现了乱码,你可以看看bert里vocab.txt这个文件打开是不是正常的汉字,erine是正常的

我看了一下 我bert里vocab.txt这个文件中的文字跟作者放的链接里面的是一样的 但是我觉得这个中文有点儿奇怪

https://blog.csdn.net/m0_38133212/article/details/88614153

dovelz avatar Jun 19 '20 02:06 dovelz

我也是bert跑出来准确率50左右 为什么我按照源代码 原数据集训练出来的准确率 和你的差很多呢 而且时间也很长 我检查了下是词表出现了乱码,你可以看看bert里vocab.txt这个文件打开是不是正常的汉字,erine是正常的 我看了一下 我bert里vocab.txt这个文件中的文字跟作者放的链接里面的是一样的 但是我觉得这个中文有点儿奇怪

https://blog.csdn.net/m0_38133212/article/details/88614153

谢谢您 十分感谢

ZMM6128 avatar Jun 19 '20 03:06 ZMM6128

我也是bert跑出来准确率50左右 为什么我按照源代码 原数据集训练出来的准确率 和你的差很多呢 而且时间也很长 我检查了下是词表出现了乱码,你可以看看bert里vocab.txt这个文件打开是不是正常的汉字,erine是正常的 我看了一下 我bert里vocab.txt这个文件中的文字跟作者放的链接里面的是一样的 但是我觉得这个中文有点儿奇怪

https://blog.csdn.net/m0_38133212/article/details/88614153

我也是bert跑出来准确率50左右

你好 我想问一下 处理自己的数据集的时候 出现这个问题ValueError: too many values to unpack (expected 2)怎么解决

ZMM6128 avatar Jul 01 '20 03:07 ZMM6128

我也是bert跑出来准确率50左右 为什么我按照源代码 原数据集训练出来的准确率 和你的差很多呢 而且时间也很长 我检查了下是词表出现了乱码,你可以看看bert里vocab.txt这个文件打开是不是正常的汉字,erine是正常的 我看了一下 我bert里vocab.txt这个文件中的文字跟作者放的链接里面的是一样的 但是我觉得这个中文有点儿奇怪

https://blog.csdn.net/m0_38133212/article/details/88614153

我也是bert跑出来准确率50左右

你好 我想问一下 处理自己的数据集的时候 出现这个问题ValueError: too many values to unpack (expected 2)怎么解决

你自己的数据集应该是多分类的 但是你自己设置的是二分类的 你需要做对应的修改

Chen65010445 avatar Sep 29 '20 03:09 Chen65010445

损失值一直在2.0或者1.5左右 出来的结果也是在50左右是为什么呀

LiuSY avatar Oct 10 '22 12:10 LiuSY