DSD-SATN
DSD-SATN copied to clipboard

Published 20 hours ago •

Reame
Issues

数据细节问题

Open zhLawliet opened this issue 3 years ago • 11 comments

你好，很感谢提供了3dpw和hm36的标签，这里有几个疑惑。关于pw3d：企业微信截图_32b5d1a3-7cb3-4008-a212-208862945352 问题1：为什么使用的betas是annots_hmrvideo的而不是pw3d原始提供的beta；问题2：label['cam_rotation_matrix'] = raw_labels['cam_poses'][j,:3,:3] ，看你的centerHMR，这个相机外参矩阵应该是乘以到pose的global_rotation。在进行最终的监督时，不要单独监督这个相机外参。但是看你最终返回的dataset，好像没有使用这个相机外参。企业微信截图_4a156cd0-728c-4817-8d1f-002b30113ae8 所以这里的pose，其实没有对global_rotation做额外的处理？

May 31 '21 08:05 zhLawliet

关于hm3.6 企业微信截图_b0a32587-d2d4-4608-904e-71faa2304750 1 每一张图对应上面的标签，这里cam，pose，trans，都有三个值，再使用的时候，代码里面是随机选择的，是不是说明这三组数据差不多？

2 同理pw3d,关于pose的处理，这里发现直接将info['cam']赋值给了pose：pose[:3] = root_rotation。所以很困惑，上面的pw3d的pose[:3] 是原始的global_rotation，而这里的pose[:3]被赋值了info['cam']。他们是等价的吗？如何我要使用这个数据集，那么这个cam * pose[:3] 跟canterHMR输的的pose[:3]才是等价的？

May 31 '21 08:05 zhLawliet

对于前两个问题，因为ＤＳＤ这篇文章的主要competitor就是ＨＭＲ－ｖｉｄｅｏ，所以采用和它一样的ＧＴ用于评测，主要用于性能对比。所有的设置都是为了与ＨＭＲ－ｖｉｄｅｏ的设置保持一致的。

关于h36m数据集，因为每一帧都是按照每五帧采一帧下采样出来的，每一帧有３个ＳＭＰＬ参数是３个真正临近帧的ＳＭＰＬ，随机采样是为了避免过拟合，因为真正临近帧动作基本一致。

对于３ＤＰＷ数据集的处理还是建议看ＲＯＭＰ的相关部分代码。

May 31 '21 10:05 Arthur151

好的谢谢

May 31 '21 10:05 zhLawliet

我这里2D pose对的挺好的呀，没什么问题。 575_S11_Discussion 1_3_462 jpg_centermap 我好像是丢弃了每个视频前１５帧，应该是整个采样平移了５为倍数的帧数，你可以试一下。具体的太久远，忘记了。。。

Jun 01 '21 02:06 Arthur151

好的，谢谢，我这边实验应该是丢弃了第一帧之后，再整个采样平移了５为倍数的帧数。采用cv2.VideoCapture默认帧率进行抽帧。

Jun 01 '21 10:06 zhLawliet

恩恩，我中间迭代了几版，都忘记怎么搞得了。方便把数据处理代码（图片抽取）开源给大家么？

Jun 01 '21 10:06 Arthur151

好的，我整理一下，发出来

Jun 01 '21 11:06 zhLawliet

Thanks for your time and contribution to this respository.

Jun 01 '21 11:06 Arthur151

h36m_preprocess_video.py.zip 目前通过这个视频抽帧脚本（每一个视频完成解码，5倍采样，舍弃采样得到的第一帧），完成了S11和S9抽帧并验证，其中每一个视频完成抽帧验证，发现基本都是对的。但是其中S9_Greeting_[0|1|2|3] 好像平移不对如下图：

除了S9_Greeting_这个动作视频有问题，其他S9和S11的视频基本都是对的：

Jun 02 '21 09:06 zhLawliet

感谢！我也发现有平移的问题了。貌似是ground truth本身有问题。但不影响3D pose 评测。 S9通常protocol里都只用来作为test set，不能用于训练的。

Jun 02 '21 09:06 Arthur151

嗯，谢谢

Jun 02 '21 10:06 zhLawliet