mPLUG-DocOwl icon indicating copy to clipboard operation
mPLUG-DocOwl copied to clipboard

这个可以拿来做PI CI图片信息抽取吗?

Open zhangquanwei962 opened this issue 2 years ago • 1 comments

你好,作者,很感谢你的工作,我拿mPLUG-DocOwl的网上demo来测试了一下相关的PI CI图片,我的目标是让模型得到有关字段的结构化数据,为了更快的审核。 但是现在的demo的效果不尽人意,问相关字段的值很容易出现语言幻觉和回答的不对,回答的数字什么的都是错误的,请问可以通过微调的方式让他更对一些吗,或者是增加它的OCR能力? 期待你的回复。 AMMER

zhangquanwei962 avatar Oct 25 '23 01:10 zhangquanwei962

Hi, @zhangquanwei962 ,我们目前更新了一版DocOwl,信息抽取能力更强了一点: C100336F-D6C8-41C0-9E95-64D0DBB9F229 不过,某些情况还是存在错误的情况,我们后续会开源微调代码,您可以根据您的场景微调模型达到更优的效果~

HAWLYQ avatar Apr 10 '24 02:04 HAWLYQ