DSD-SATN icon indicating copy to clipboard operation
DSD-SATN copied to clipboard

数据细节问题

Open zhLawliet opened this issue 3 years ago • 11 comments

你好,很感谢提供了3dpw和hm36的标签,这里有几个疑惑。 关于pw3d: 企业微信截图_32b5d1a3-7cb3-4008-a212-208862945352 问题1:为什么使用的betas是annots_hmrvideo的而不是pw3d原始提供的beta; 问题2:label['cam_rotation_matrix'] = raw_labels['cam_poses'][j,:3,:3] ,看你的centerHMR,这个相机外参矩阵应该是乘以到pose的global_rotation。在进行最终的监督时,不要单独监督这个相机外参。但是看你最终返回的dataset,好像没有使用这个相机外参。 企业微信截图_4a156cd0-728c-4817-8d1f-002b30113ae8 所以这里的pose,其实没有对global_rotation做额外的处理?

zhLawliet avatar May 31 '21 08:05 zhLawliet

关于hm3.6 企业微信截图_b0a32587-d2d4-4608-904e-71faa2304750 1 每一张图对应上面的标签,这里cam,pose,trans,都有三个值,再使用的时候,代码里面是随机选择的,是不是说明这三组数据差不多?

2 同理pw3d,关于pose的处理,这里发现直接将info['cam']赋值给了pose:pose[:3] = root_rotation。所以很困惑,上面的pw3d的pose[:3] 是原始的global_rotation,而这里的pose[:3]被赋值了info['cam']。他们是等价的吗?如何我要使用这个数据集,那么这个cam * pose[:3] 跟canterHMR输的的pose[:3]才是等价的? image

zhLawliet avatar May 31 '21 08:05 zhLawliet

对于前两个问题,因为DSD这篇文章的主要competitor就是HMR-video,所以采用和它一样的GT用于评测,主要用于性能对比。所有的设置都是为了与HMR-video的设置保持一致的。

关于h36m数据集,因为每一帧都是按照每五帧采一帧下采样出来的,每一帧有3个SMPL参数是3个真正临近帧的SMPL,随机采样是为了避免过拟合,因为真正临近帧动作基本一致。

对于3DPW数据集的处理还是建议看ROMP的相关部分代码

Arthur151 avatar May 31 '21 10:05 Arthur151

好的谢谢

zhLawliet avatar May 31 '21 10:05 zhLawliet

我这里2D pose对的挺好的呀,没什么问题。 575_S11_Discussion 1_3_462 jpg_centermap 我好像是丢弃了每个视频前15帧,应该是整个采样平移了5为倍数的帧数,你可以试一下。具体的太久远,忘记了。。。

Arthur151 avatar Jun 01 '21 02:06 Arthur151

好的,谢谢,我这边实验应该是丢弃了第一帧之后,再整个采样平移了5为倍数的帧数。采用cv2.VideoCapture默认帧率进行抽帧。

zhLawliet avatar Jun 01 '21 10:06 zhLawliet

恩恩,我中间迭代了几版,都忘记怎么搞得了。方便把数据处理代码(图片抽取)开源给大家么?

Arthur151 avatar Jun 01 '21 10:06 Arthur151

好的,我整理一下,发出来

zhLawliet avatar Jun 01 '21 11:06 zhLawliet

Thanks for your time and contribution to this respository.

Arthur151 avatar Jun 01 '21 11:06 Arthur151

h36m_preprocess_video.py.zip 目前通过这个视频抽帧脚本(每一个视频完成解码,5倍采样,舍弃采样得到的第一帧),完成了S11和S9抽帧并验证,其中每一个视频完成抽帧验证,发现基本都是对的。 但是其中S9_Greeting_[0|1|2|3] 好像平移不对 如下图: image image

除了S9_Greeting_这个动作视频有问题,其他S9和S11的视频基本都是对的: image image

zhLawliet avatar Jun 02 '21 09:06 zhLawliet

感谢! 我也发现有平移的问题了。貌似是ground truth本身有问题。但不影响3D pose 评测。 S9通常protocol里都只用来作为test set,不能用于训练的。

Arthur151 avatar Jun 02 '21 09:06 Arthur151

嗯,谢谢

zhLawliet avatar Jun 02 '21 10:06 zhLawliet