这个可以拿来做PI CI图片信息抽取吗？

Open zhangquanwei962 opened this issue 2 years ago • 1 comments

你好，作者，很感谢你的工作，我拿mPLUG-DocOwl的网上demo来测试了一下相关的PI CI图片，我的目标是让模型得到有关字段的结构化数据，为了更快的审核。但是现在的demo的效果不尽人意，问相关字段的值很容易出现语言幻觉和回答的不对，回答的数字什么的都是错误的，请问可以通过微调的方式让他更对一些吗，或者是增加它的OCR能力？期待你的回复。 AMMER

Oct 25 '23 01:10 zhangquanwei962

Hi, @zhangquanwei962 ,我们目前更新了一版DocOwl，信息抽取能力更强了一点： C100336F-D6C8-41C0-9E95-64D0DBB9F229 不过，某些情况还是存在错误的情况，我们后续会开源微调代码，您可以根据您的场景微调模型达到更优的效果～

Apr 10 '24 02:04 HAWLYQ