Super-BPD
Super-BPD copied to clipboard
请问一下刚开始训时,loss大概在哪个数量级?我在自己数据集上训时初始为万级别
因为没有做归一化所以数量级很大,训练到后面loss会降低很多,可视化效果来看网络已经训练得不错了