einvoice icon indicating copy to clipboard operation
einvoice copied to clipboard

全电发票暂时还不能识别,请问大佬什么时候能支持一下,感激不尽

Open vanpersie9 opened this issue 2 years ago • 8 comments

vanpersie9 avatar Nov 09 '22 07:11 vanpersie9

ofd可以识别

sanluan avatar Nov 09 '22 10:11 sanluan

现在遇到了部分全电发票是pdf的,type能否识别为全电,另外大致的都能识别出来,buyer和seller的定位是错的,不知道大佬能否帮忙看是否可以支持一下,感激不尽

vanpersie9 avatar Nov 09 '22 10:11 vanpersie9

我这没有这类发票 后面可能要不同发票类型 不同地区区分处理了 这个识别主要是按位置逐行取文本的 不同地区 不同类型 排版差异较大

sanluan avatar Nov 09 '22 11:11 sanluan

非常感谢大佬,目前测试和使用的还是比较顺畅的 目前有一些存在问题,我只能按照自己的笨方法先解决了一下,我给您说一下,您看可以改进一下 1、目前一些发票的detail模块存在规格型号也是纯数字的情况,在您的代码里面根据数字去判断的时候,就导致了规格,单位错位了 2、ofd存在一些特殊情况识别不出来,版式用的跟PDF的一样的格式,这种情况下就没办法识别,不知道咋回事,会报entry是Null,我只能先把ofd转成pdf再识别,但是转成pdf之后,最右侧的下载次数会被纳入到识别范围内,因为转换之后字体变化了,总体撑大了 3、没有方法能自动识别是全电发票还是老版的发票,我目前能想到的就是根据读出来的fulltext是否包含电子发票这种字样来判断是否为全电发票

vanpersie9 avatar Nov 16 '22 05:11 vanpersie9

pdf识别部分没有特别理想的方法 就是根据各种线索 把发票种类先识别出来 然后针对不同类型不同地区的发票做 位置适配,目前的代码里面通用性 已经比较难提升了 ofd是直接读取的文件里面的发票数据

sanluan avatar Nov 16 '22 06:11 sanluan

现在遇到了部分全电发票是pdf的,type能否识别为全电,另外大致的都能识别出来,buyer和seller的定位是错的,不知道大佬能否帮忙看是否可以支持一下,感激不尽

pdf的全电,我搞定了。 OFD的全电,用作者方法,读不到内容

82kg avatar Oct 09 '23 03:10 82kg

现在遇到了部分全电发票是pdf的,type能否识别为全电,另外大致的都能识别出来,buyer和seller的定位是错的,不知道大佬能否帮忙看是否可以支持一下,感激不尽

pdf的全电,我搞定了。 OFD的全电,用作者方法,读不到内容

怎么做的呢?我们现在好多也是全电发票

mejinke avatar Nov 02 '23 04:11 mejinke

现在遇到了部分全电发票是pdf的,type能否识别为全电,另外大致的都能识别出来,buyer和seller的定位是错的,不知道大佬能否帮忙看是否可以支持一下,感激不尽

pdf的全电,我搞定了。 OFD的全电,用作者方法,读不到内容

能分享一下吗

qlmajun avatar Nov 09 '23 14:11 qlmajun