sanluan
sanluan
https://github.com/sanluan/ueditor 这里的版本支持word图片自动上传 base64图片转存文件
新版本已经修改
第三方客户端得必然下场
没有任何一个官方会一直放任第三方 也不会有招安的
看了看错误日志是 里面一个文件不存在,ofd格式比较简单 当作zip打开后 有一些xml文件能直接拿到发票数据 你们这个地方的好像和一般的电子发票不太一样 你可以研究下 OfdInvoiceExtractor.extract方法 和 这个文件里面的xml
ofd可以识别
我这没有这类发票 后面可能要不同发票类型 不同地区区分处理了 这个识别主要是按位置逐行取文本的 不同地区 不同类型 排版差异较大
pdf识别部分没有特别理想的方法 就是根据各种线索 把发票种类先识别出来 然后针对不同类型不同地区的发票做 位置适配,目前的代码里面通用性 已经比较难提升了 ofd是直接读取的文件里面的发票数据
发票的识别是基于位置的 版面的变化可能会导致识别错误 因为测试资源有限 只适配了常见的发票格式 且没有对不同发票进行区分,更理想的做法是先识别排版 区分票种,然后针对不同票种做版面文字提取识别
本程序的原理是读取文件内容,扫描二维码那种一般是发票号码去税局查询详情 各有利弊