information-extraction icon indicating copy to clipboard operation
information-extraction copied to clipboard

完全按照readme操作,为什么loss降低到5就过拟合了

Open beeper00 opened this issue 3 years ago • 0 comments

pass_num改到99999,不然100次就会停下来。 其余完全不变,使用GPU训练到400多个pass时,avg_cost达到最低的5.1,之后就越来越高,过拟合了。 请问这是为什么?不是说要训练到3以下吗?

beeper00 avatar Jul 01 '21 01:07 beeper00