sanluan
Results
14
comments of
sanluan
随着数电票的推广 这类识别和发票详情获取已经没有意义了 这条路已经走到尽头了
应该是xml中这个节点
pdf是首先提取所有文本,然后根据位置查找文字,pdf里面提取的文字不是一行一行的 而是一个字一个字的 有时候就会错乱,读取备注首先注意位置定位,其次就是可能有章里得文字
尤其是 https://registry-1.docker.io