Results 6 comments of jacklin

> @Lanme ,针对不定长的文本,你需要:1. 在batch内将图片统一宽度或者整个数据集用同样的宽度。2. 为了batch训练,你需要将标注的label填充为统一的长度(用blank进行填充)。 你好,請問,blank填充是指你的字典裡有一個字符是" "空格嗎?還是你以其他字符代表?

我想低的地方是去cpu做一些預處理與後處理,看起來預處理站比較多,所以 我將keras改為tf.keras,把資料用tfrecord先處理好後,嘗試使用estimator,目前還有bug,我們可以討論一下 我覺得用tfrecord先處理好圖片,即使不用estimator應該也會有所提升

我嘗試padding是可以訓練的,非常感謝,看起來字典裡的'卍'字應該是用來當作填充字符

我訓練字數1、2、3、10,目前是先生成100萬張圖片,我看他下降太慢,所以learning rate 一開始設0.05,step為十萬,目前是訓練五個epoch時間為1-2小時,字數越多訓練越久,目前訓練12小時,一個字正確率大概是0.62,十個字是0.12,所以差不多調到0.05其實不會太大,他還是會持續下降,我到第11個epoch正確率就開始不是零了,順帶一提,目前我是12小時後把 lr 在下調到0.005,不過或許你也可以在lr忽大忽小時再把lr調小

加深網路後解決了感謝 應該是欠擬合

按照DenseNets論文結構適當的加深,你也可以試試看先加深卷積就好