GRIP icon indicating copy to clipboard operation
GRIP copied to clipboard

Argoverse数据集的训练与测试问题

Open KevinDu1 opened this issue 4 years ago • 2 comments
trafficstars

感谢大佬精彩的分享,我最近使用Argoverse数据集10步的历史轨迹(1s)去预测30步(3s)的未来轨迹,在训练过程中,前几个epoch结果良好,到了五六个epoch时发生了梯度爆炸,损失函数从原来的0.01升到了10,20,请问,您知道这是怎么回事吗

KevinDu1 avatar Jul 29 '21 12:07 KevinDu1

@KevinDu1 首先非常感谢你对我们工作的支持。这个表现具体是什么原因比较难判断,不过有可能是数值稳定性的问题,建议检查以下几个地方: (1). 确保输入到模型的数据是对的。我分享出来的code是在Apollo数据集上的,dataloader范围的dimension比较多,在main.py [line94] 选择需要输入到模型的dimension,main.py[line99]计算velocity。可以double check一下输入是否正确。(2). 虽然固定了输入车辆的个数N, 但是在处理数据的时候,我把所有valid的objects排在了前边,参见data_process.py[line47] process_data()函数,[line49]取到有效的object个数num_visible_object。这一点在处理数据的时候也可以注意一下。(3).有可能Argoverse数据及上的数据范围比较特殊,可以尝试做一下rescale。我的code里实际上实现了这一功能,main.py [27-28] 对应修改max_x 和 max_y。 (4). 可以尝试在训练时候添加gradient clipping,以避免梯度异常。

xincoder avatar Jul 29 '21 13:07 xincoder

感谢大佬精彩的分享,我最近使用Argoverse数据集10步的历史轨迹(1s)去预测30步(3s)的未来轨迹,在训练过程中,前几个epoch结果良好,到了五六个epoch时发生了梯度爆炸,损失函数从原来的0.01升到了10,20,请问,您知道这是怎么回事吗

你好,请问你在Argoverse的移植成功了吗,可以留邮箱咨询一些问题吗,感谢~

sean-wade avatar Jan 03 '23 02:01 sean-wade