粽子
粽子
I have noticed that you talked about the way for unsupervised learning. Did you offer an unsupervised version in this repo?
### 请提出你的问题 运行ERNIE—Layout模型报错,命令为[readme页面](https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout#41-key-information-extraction)的命令,原封不动 ``` python -u run_ner.py \ --model_name_or_path ernie-layoutx-base-uncased \ --output_dir ./ernie-layoutx-base-uncased/models/xfund_zh/ \ --dataset_name xfund_zh \ --do_train \ --do_eval \ --lang "ch" \ --max_steps 20000 \ --eval_steps 100 \...
使用模型det_r50_vd_db hmean只有0.63、精确度只有0.73 [2022/11/05 04:35:15] ppocr INFO: best metric, hmean: 0.6345609065155807, is_float16: False, precision: 0.7384615384615385, recall: 0.5562913907284768, fps: 29.827697440209544, best_epoch: 411 场景是学历学位证的OCR识别,数据特点:存在红章的干扰、部分数据存在背景干扰、每行文字中有较多的空格 我自己标注的标准是,尽可能的以文本行为单位进行标注、章中间的红字不进行标注(担心章内文字对后续的信息抽取造成干扰),示例如下(关键信息已打码) data:image/s3,"s3://crabby-images/0f1ed/0f1ed95192c79761217de91449c9cd01c51291c3" alt="image" 查看了一下识别结果 1、有章干扰的部分检测结果糟糕,漏检比较严重,并且章内的文字依然会检测到 2、检测框大部分还是按空格分开的(没有像标注的那样按行,是否标注时也标注得更细一点会更好?) 希望大佬们给点建议!
When i run the model with the ml_1m and met this error