yuxzho
yuxzho
have you solved this problem?
Downgrade your pytorch version to 1.1.0 can clear up the error
It is a especial case, for others grobid works well
@kermitt2 Thanks for your reply! I am running with the latest container 0.7.1, and calling service /api/processFulltextDocument. The memory is over 1TB on the server.
if you use your own dataset: 1. make sure all the labels are not empty 2. make sure the length of the predicted sequence > 2 * length(label) + 1
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe7 in position 2270: invalid continuation byte
@TITC this work for me ```io.open(output_file, 'r', encoding='latin-1')```
> 您好,打扰了,我想使用印刷体数据集进行训练,但是当我把config中与数据集相关的配置文件转换成自己的以后,出现了图中所示的问题。请问您在训练运行的过程中出现了类似的问题吗?可以帮忙提一点建议吗?  读图的时候读灰度图
> 你好,我想测试一下模型在印刷体公式识别上的效果,测试的ExpRate达到0.8,但是另外使用外来的图片预测的时候,结果总是一串相同的字符,这会是什么原因引起的呢? > > 输入图片:  > > 程序结果: ![92959e6c1ddf7e6c0be4ba116882d78](https://user-images.githubusercontent.com/50820616/202946248-e668071a-ea14-4112-81f2-2d741c61b332.jpg @yazheng0307 我拿数据集之外的图片来测效果也很差,似乎模型的泛化能力不好?请问你解决了吗
@ZeroCodePro Hello, 结果的指标是F1-score,iou>0.7的算作TP,这个是按照当时比赛的评估标准来的,可以参考evaluate.py
检测框偏移的问题更像是模型还没训好,可以观察一下在验证集上的指标是多少