Results 2 issues of jacklin

大家好,我目前是使用跟博主產生數據集相似,做傾斜、fit、不同字型、以及灰度的繁體字圖片,數據為4800字,主要產生於wiki文件、連續數字、地址、隨機文字,產生長度固定為10個字,目前我steps_per_epoch = 1000000,產生300萬張圖片訓練 設備是TITAN Xp (12G) 其他地方沒有更動,可是我已經訓練了5天以上了,loss下降的非常慢,且accuracy一直停留在67%左右,大概已經有9小時左右(10個epoch左右),訓練都沒有再進步了 但我使用10萬筆數據集,在空白背景是有不錯效果的,請問這是欠擬合,需要加深層數嗎? 想請問一下大家的意見,如果有描述不清楚的地方可以再補充 p.s.有沒有訓練得很成功的朋友,可以提供給我一些訓練數量,訓練時間與設備的參考,因為我對要訓練多久目前很不確定

我想訓練不定長圖片 我目前是batch size設為1才能夠執行 但這樣我的訓練速度明顯變慢 想請問有沒有人有其他辦法?