chinese_ocr icon indicating copy to clipboard operation
chinese_ocr copied to clipboard

请教,我看别人只用DenseNet也能做ocr识别, 为何还要加ctpn?

Open woshi91 opened this issue 5 years ago • 7 comments

请教,我看别人只用DenseNet也能做ocr识别, 为何还要加cptn?

woshi91 avatar Feb 27 '19 05:02 woshi91

CTPN是用来定位图片中的文本的

YCG09 avatar Feb 28 '19 02:02 YCG09

input = Input(shape=(32, None, 1), name='the_input') y_pred= densenet.dense_cnn(input, nclass) basemodel = Model(inputs=input, outputs=y_pred)

请教, 这是将height固定为32, width None为无限制? ctpn截取的大小是否要高度重置为32, 宽度不用变?

DenseNet是121还是?

看到一个默认的大小为shape=(32, 280, 1)

这个大小是必须的吗? 我能改为其他尺寸?

woshi91 avatar Mar 01 '19 02:03 woshi91

是高度32,宽度无限制。

发送自 Windows 10 版邮件应用

发件人: woshi91 发送时间: 2019年3月1日 10:51 收件人: YCG09/chinese_ocr 抄送: Subscribed 主题: Re: [YCG09/chinese_ocr] 请教,我看别人只用DenseNet也能做ocr识别, 为何还要加ctpn? (#171)

input = Input(shape=(32, None, 1), name='the_input') y_pred= densenet.dense_cnn(input, nclass) basemodel = Model(inputs=input, outputs=y_pred) 请教, 这是将宽固定为32, 高度None为无限制? DenseNet是121还是? — You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or mute the thread.

xiaoyubing avatar Mar 01 '19 07:03 xiaoyubing

@xiaoyubing 抱歉, 写错了, 后来改过来了 input = Input(shape=(32, None, 1), name='the_input') y_pred= densenet.dense_cnn(input, nclass) basemodel = Model(inputs=input, outputs=y_pred)

请教, 这是将height固定为32, width None为无限制? ctpn截取的大小是否要高度重置为32, 宽度不用变?

DenseNet是121还是?

看到一个默认的大小为shape=(32, 280, 1)

这个大小是必须的吗? 我能改为其他尺寸?

woshi91 avatar Mar 01 '19 07:03 woshi91

可以改其他尺寸,训练过程保证尺寸统一就行

YCG09 avatar Mar 19 '19 08:03 YCG09

@YCG09 ,作者你好,想问下评估时是ctpn和densenet分别评估召回率,准确率吗?有没有评估的代码?

666888985 avatar Jul 04 '20 08:07 666888985

@YCG09 有没有完整一体化的代码,检测识别一起训练的,先经过ctpn检测然后经过densenet和ctc识别,这样训练的,这样就直接评估识别部分就好了,不用再评估检测部分了

666888985 avatar Jul 04 '20 10:07 666888985