mPLUG-DocOwl
mPLUG-DocOwl copied to clipboard
这个可以拿来做PI CI图片信息抽取吗?
你好,作者,很感谢你的工作,我拿mPLUG-DocOwl的网上demo来测试了一下相关的PI CI图片,我的目标是让模型得到有关字段的结构化数据,为了更快的审核。
但是现在的demo的效果不尽人意,问相关字段的值很容易出现语言幻觉和回答的不对,回答的数字什么的都是错误的,请问可以通过微调的方式让他更对一些吗,或者是增加它的OCR能力? 期待你的回复。
Hi, @zhangquanwei962 ,我们目前更新了一版DocOwl,信息抽取能力更强了一点:
不过,某些情况还是存在错误的情况,我们后续会开源微调代码,您可以根据您的场景微调模型达到更优的效果~