SoftMaskedBert icon indicating copy to clipboard operation
SoftMaskedBert copied to clipboard

想问一下如何进行预测?

Open travel-go opened this issue 3 years ago • 13 comments

如题,成功跑起来了代码,想问一下怎么进行模型预测,直接打印对应的预测概率吗

travel-go avatar Oct 21 '21 07:10 travel-go

参照计算准确率的那一步,取argmax之后decode就行,也可以取topk再decode,毕竟有些位置的字,完全可行的不止一个,这样也可以提高容错率

quantum00549 avatar Oct 21 '21 07:10 quantum00549

我预测出的结果基本上都是乱码,感觉整个模型训练有点问题,你有离线预测过结果吗

travel-go avatar Oct 21 '21 13:10 travel-go

我这边没问题,已经运用了,乱码是指[mask]过多,还是[unk]过多?我实际中是用另一份数据训练的,这个只是样例

quantum00549 avatar Oct 22 '21 06:10 quantum00549

我这边用的是新闻的数据集跑了一下,预测出来的结果都是 “#”这种特殊符号,感觉模型都没有学到对应的信息

travel-go avatar Nov 01 '21 08:11 travel-go

这个就得好好排查了,可能是没收敛,也可能预测代码有问题

quantum00549 avatar Nov 01 '21 08:11 quantum00549

没收敛不太可能,我训练了19个epoch,预测代码我排查过,topN的返回结果基本上都是错的;感觉问题很奇怪

travel-go avatar Nov 01 '21 08:11 travel-go

方便加个微信聊聊?

travel-go avatar Nov 01 '21 08:11 travel-go

赞一个,代码比别家要好不少

hxc123fau avatar Nov 18 '21 08:11 hxc123fau

数据中的训练和测试语料格式不一样

ovn-qian avatar Feb 14 '22 04:02 ovn-qian

你好 这个问题解决了吗

huhuhu5798 avatar Feb 14 '22 09:02 huhuhu5798

我也是遇到了同样的问题,请你解决了吗

没收敛不太可能,我训练了19个epoch,预测代码我排查过,topN的返回结果基本上都是错的;感觉问题很奇怪

huhuhu5798 avatar Feb 14 '22 09:02 huhuhu5798

参照计算准确率的那一步,取argmax之后decode就行,也可以取topk再decode,毕竟有些位置的字,完全可行的不止一个,这样也可以提高容错率

代码是跑通了,但是测试数据是怎么进行测试的?如果想查看预测的文本可以怎么查看呢?

lewispony avatar Jun 02 '22 10:06 lewispony

epoch: 20, batch: 75, train loss: 0.1110184316833814%, train detector accuracy: 0.7455034374286511, train corrector_accuracy: 0.9996765519165884

同问怎么进行预测,代码细节没看懂

myaijarvis avatar Sep 08 '22 08:09 myaijarvis