Yu Sun

Results 301 comments of Yu Sun

从提供的pretrain训练半天到一天时间能训到95%以上的性能,训得越久效果越好。从头训可能要一个月时间。 Get Outlook for Android

pre-trained backbone 采用的不一样的head 来学习2D pose estimation之类的其他任务,预训练出来的模型,因为在相似的任务上pretrain过,所以会收敛的比较快。 pre-trained model是指的是我训练好的模型。从0开始训一般采用例如ImageNet上训练的参数,需要比较长的时间构建基础特征。我这里提供的pre-trained backbone就是帮大家节省时间,跳过基础特征构建部分。

还是建议您使用pretraining模型来减少训练时间,而且大batch size对于pretraining还是很重要的,不然真的要训很久很久的。您可以等一两个周再来看结果,估计就能下降到和使用pretraining模型训练差不多的loss了。

您把[hrnet_pretrain](https://github.com/Arthur151/ROMP/blob/d463cbccc6a4456270d8d52fcfa1e9e26b6c4f02/romp/lib/config.py#L87)的路径设置好了,然后[自动调用backbone](https://github.com/Arthur151/ROMP/blob/d463cbccc6a4456270d8d52fcfa1e9e26b6c4f02/romp/lib/models/modelv1.py#L34)就会在[这里](https://github.com/Arthur151/ROMP/blob/d463cbccc6a4456270d8d52fcfa1e9e26b6c4f02/romp/lib/models/hrnet_32.py#L33)加载预训练参数用于训练。

1.目前训练速度确实比较慢,我在4块P40上一个batch(64)大概1.72,不太清楚在1080Ti上是什么速度。 2.您的GPUS设置错误,您log里显示您'GPUS': '7',如果想使用0-4号四个gpu训练,'GPUS': 0,1,2,3这样设置。 3.如果调用预训练主干训练,大概在2-3个epoch就能达到测试集的较优结果,但需要比较好的繁华性和稳定性,还是要尽可能训久一点。 也祝您身体健康~~

这就是模型加载之前训练的参数失败了。pytorch会以字典的形式保存参数,格式是: 层名:参数。例如,'backbone.conv1.weight': torch.Tensor([.....]) 这里加载失败大概率是层名没有对上,导致pytorch在记载之前的参数的时候,加载失败了。 您可以看一下[这个函数](https://github.com/Arthur151/ROMP/blob/2a28118d4be15aa0cf39c297ee0d0c67dda05a4d/romp/lib/utils/train_utils.py#L15)。应该就是[这里](https://github.com/Arthur151/ROMP/blob/2a28118d4be15aa0cf39c297ee0d0c67dda05a4d/romp/lib/utils/train_utils.py#L25)的k没找到。

Hi, MJ Shin @170928 Thanks a lot for pointing out this error! I will fix it in the next version.

并不需要进一步的计算。 表中数字是`Average Precision (AP) @[ IoU=0.50 | area= all | maxDets= 20 ] `这项,可能训练要稍微进行的久一点,checkpoint的选择也会有一点影响。 评估ROMP_HRNet32_V1.pkl,明显有bug。

Sorry, this function (directly convert to bvh) hasn't been finished. I have moved on to another function. You can convert the outputs to .fbx first and then export bvh in...