quantum00549

Results 11 comments of quantum00549

就我的推理来看,question对应的值是一个列表,列表内容为一个个数字,根据数字,使用vocab_data下id2word来找到对应的词,从而还原出具体的question

我自己在服务器上远程开发的,没遇到过这个问题;win现在可以用wsl开发,体验好得多,你可以试试

it seems streaming mode does not work properly ?

> > it seems streaming mode does not work properly ? > > Yes, As the low level api had not support streaming mode when I implement this feature. I...

确实是一个个对比的; 不过这里乘了个mask, 所以序列的补零部分被认为预测正确, 会导致准确率偏高; 至于实际输出, 我已经在公司业务里落地应用了, 你觉得输出不准的话, 这个需要仔细排查

参照计算准确率的那一步,取argmax之后decode就行,也可以取topk再decode,毕竟有些位置的字,完全可行的不止一个,这样也可以提高容错率

我这边没问题,已经运用了,乱码是指[mask]过多,还是[unk]过多?我实际中是用另一份数据训练的,这个只是样例

这个就得好好排查了,可能是没收敛,也可能预测代码有问题

似乎是预训练模型名字不对的问题(可能是改了), 去huggingface官网里找个自己需要的模型替换就行

> 不知道解决了没有,同样遇到这个问题 最佳的解决思路就是, 去transformer官网找个确定有的模型, 然后挂VPN, 代码检测不到本地模型文件的时候会自动下载