chinese_ocr icon indicating copy to clipboard operation
chinese_ocr copied to clipboard

请教一下,如何识别空格字符信息?

Open fcqfcq opened this issue 6 years ago • 9 comments

fcqfcq avatar Sep 25 '18 12:09 fcqfcq

1

fcqfcq avatar Sep 25 '18 13:09 fcqfcq

训练语料里加入含空格的样本一起训练

YCG09 avatar Oct 08 '18 08:10 YCG09

训练语料里加入含空格的样本一起训练

代码对 char =char[1:]+'卍' 进行了处理,忽略了首位空格,后面增加了占位符。如果语料新增空格,是不是就不需要做上述处理了? 代码注释 #caffe_ocr中把0作为blank,但是tf 的CTC the last class is reserved to the blank label. 说是tf需要将最后一个下标作为占位符,看来还是需要进行上述处理?

springtty avatar Oct 08 '18 08:10 springtty

保证char的长度等于要识别的字符数+1就行了

YCG09 avatar Oct 08 '18 09:10 YCG09

保证char的长度等于要识别的字符数+1就行了

就是说对CTC来说,识别空格,并不需要真的加一个“空格”的标签,因为CTC没有找到特征的时候,最后一个占位符的概率会最高。我这样理解对吗

springtty avatar Oct 09 '18 01:10 springtty

保证char的长度等于要识别的字符数+1就行了

就是说对CTC来说,识别空格,并不需要真的加一个“空格”的标签,因为CTC没有找到特征的时候,最后一个占位符的概率会最高。我这样理解对吗

char =char[1:]+'卍' 这边为什么要忽略首位空格,我想识别空格的话,空格不也应该作为一个标签吗

lu161513 avatar Mar 06 '19 06:03 lu161513

保证char的长度等于要识别的字符数+1就行了

就是说对CTC来说,识别空格,并不需要真的加一个“空格”的标签,因为CTC没有找到特征的时候,最后一个占位符的概率会最高。我这样理解对吗

char =char[1:]+'卍' 这边为什么要忽略首位空格,我想识别空格的话,空格不也应该作为一个标签吗

同问 这个问题是怎么解决的呢?

jewelcai avatar Apr 08 '19 05:04 jewelcai

保证char的长度等于要识别的字符数+1就行了

请问 需要空格那个label嘛?

jewelcai avatar Apr 09 '19 02:04 jewelcai

保证char的长度等于要识别的字符数+1就行了

请问 需要空格那个label嘛?

如果要支持对空格的识别, 我认为是需要的.

HongChow avatar May 23 '20 06:05 HongChow