PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

KIE标注

Open husiluanxiang opened this issue 1 year ago • 1 comments

image 为啥使用KIE标注的结果和官方文档给出例子的格式不同 是否有其他转换工具

husiluanxiang avatar Sep 23 '22 06:09 husiluanxiang

这个自己写一个程序优化一下就好

bank010 avatar Sep 23 '22 09:09 bank010

这个自己写一个程序优化一下就好

是否有可以参考的代码或者仓库

husiluanxiang avatar Sep 26 '22 06:09 husiluanxiang

#coding:utf-8

a = []#你自己的数据集 数据集里面有一个FALSE 加引号(不包含图片名称) n = 0 c = [] for i in a: b = {} b['transcription'] = i['transcription'] b['label'] = i['key_cls'] b['points'] = i['points'] b['id'] = n if int(b['id']) % 2 ==0: b['linking'] = [b['id'],b['id']+1] else: b['linking'] = [b['id'] - 1, b['id']] n += 1 c.append(b) print(c) #输出完在复制粘贴json文件里面就行

bank010 avatar Sep 26 '22 07:09 bank010

#coding:utf-8

a = []#你自己的数据集 数据集里面有一个FALSE 加引号(不包含图片名称) n = 0 c = [] for i in a: b = {} b['transcription'] = i['transcription'] b['label'] = i['key_cls'] b['points'] = i['points'] b['id'] = n if int(b['id']) % 2 ==0: b['linking'] = [b['id'],b['id']+1] else: b['linking'] = [b['id'] - 1, b['id']] n += 1 c.append(b) print(c) #输出完在复制粘贴json文件里面就行

好的 谢谢 不过我这边读出来的数据是个 str 格式的 不是list 而且转换的乘list后会分离开 这个应该怎么转变 image

husiluanxiang avatar Sep 26 '22 07:09 husiluanxiang

line = evel(line.split('\t')[1]) result_dict[line.split('\t')[0]] = line 后面的有一个写入json文件 还没有思路...

bank010 avatar Sep 26 '22 08:09 bank010

#coding:8 a = []#你自己的数据集 数据集里面有一个FALSE 加引号(不包含图片名称) n = 0 c = [] 对于 i in a: b = {} b['转录'] = i['转录'] b['标签' ] = i['key_cls'' b['点' ] = i['点'] b['id'] = n ifint(b['id']) % 2 ==0: b['链接'] = [b['id']],b['id']+1] 否则: b['链接'] = [b['id'] - 1, b['id']] n += 1 c.append(b) 打印(c) #输出完在复制粘贴json文件里面就行

好的 谢谢 不过我这边读出来的数据是个 str 格式的 不是list 而且转换的乘list后会分离开 这个应该怎么转变 图像

转换

bank010 avatar Sep 26 '22 09:09 bank010