kcws icon indicating copy to clipboard operation
kcws copied to clipboard

训练的准确率91%,实际测试效果和与作者提供的demo有点差距,请问大神如何能达到和demo一样的效果

Open midsummer128 opened this issue 8 years ago • 9 comments

训练模型准确率91%,实际测试效果和与作者提供的demo有点差距,请问大神如何能达到和demo一样的效果

midsummer128 avatar Dec 02 '17 02:12 midsummer128

现在准确率到97.55%,和demo还是有差距。分词效果: { "pos": "gb", "tok": "长江形成" }, { "pos": "t", "tok": "今年" }, { "pos": "nz", "tok": "第一号" }, { "pos": "n", "tok": "洪水" } 请问大神如何能做到demo的效果

midsummer128 avatar Dec 12 '17 07:12 midsummer128

@midsummer128 你有基于原始结构进行调整吗? 我windows的,不知道该怎么跑。。。

qujinqiang avatar Dec 26 '17 08:12 qujinqiang

@qujinqiang 没有调整原始结构,我是在linux跑的,虚拟机

midsummer128 avatar Jan 23 '18 02:01 midsummer128

@midsummer128 我也是用2014的语料做的训练,准确率也就91%; 整体结构跟kcws 类似 也是采用bi-lstm + crf 请问兄是怎么跑到97%的? 兄要是方便交流的话还望加下我的Q:273459197

qujinqiang avatar Jan 24 '18 07:01 qujinqiang

我跑了下也是91%,demo的97%怎么跑的?

nwy2010 avatar Apr 23 '18 07:04 nwy2010

用2014+1998的语料库,IDCNN可以跑到98.35%左右

AlleyEli avatar Jun 28 '18 02:06 AlleyEli

@AlleyEli 感谢回复,是否有命名实体识别的训练方法,基于BiLSTM-CRF模型的命名实体识别的语料标注方法

midsummer128 avatar Jul 04 '18 07:07 midsummer128

@midsummer128 这个确实蛋疼,有好的方法还望交流

qujinqiang avatar Jul 04 '18 09:07 qujinqiang

@midsummer128 命名实体识别没有单独搞, 不过IDCNN和BILSTM都命名实体识别都不太理想

AlleyEli avatar Jul 06 '18 04:07 AlleyEli