GaitSet About the set cardinality and pxk in triplet loss

你好，非常感谢你分享那么优秀的工作。而且你的代码非常清楚，对于刚入门的人很友好。但是我想问一下 set cardinality = 30 是每个视角下取30张图片， p = 8 and k = 16 是取8个人，每个视角下取16/30张图片的意思么？因为之前并没有接触过太多 Triplet Loss的知识。 Thanks for your reply！

Apr 26 '19 12:04 Fly2flies

您好，p是人数，k是没人取的样本数，k=16即每人取16个样本（视频）。然后每个样本中随机抽取30张图片做为输入的set。

Apr 29 '19 09:04 AbnerHqC

您好，p是人数，k是没人取的样本数，k=16即每人取16个样本（视频）。然后每个样本中随机抽取30张图片做为输入的set。作者大大您好，之前我也对这个输入的frame_num=30困扰看了您的解释后有点明白. 我想向您确认下， (1)k=16即每人取16个样本（视频）这句话视频是不是指的是view 文件夹下的多个轮廓图组成为一个视频序列？还是指的是3种步行条件下多个view一起的视频（说的有点乱） (2)p=8 应该指的是 subject 受试者（也就是124个?）

May 03 '19 04:05 Wei-i

是的，多个轮廓图组成的视频序列～p是124个人

May 03 '19 07:05 AbnerHqC

是的，多个轮廓图组成的视频序列～p是124个人

谢谢作者的回复！！我想了下那每个人的视频应该有 6个步行状态*11个view角度=66个视频总数

May 03 '19 08:05 Wei-i

是的，多个轮廓图组成的视频序列～p是124个人

作者大大我还想再问下关于输入的问题Xi 有以下四个维度: "set dimension, image channel dimension,image hight dimension, and image width dimension" 我想问下这个四个维度就是普通的（N，C,H,W）吗（1） N是batch_size的数量？（2） channel就是图像的通道数吗（我浅薄的理解是 whd的d）？我看到您的代码中Gaitset.py也有出现过"N,C,H,W=gl.size()" 但我的老师和我说 N和C可能不是这个意思我有点疑惑希望作者大大在有空的时候指点一下这4维的输入谢谢！

May 03 '19 08:05 Wei-i

您好，p是人数，k是没人取的样本数，k=16即每人取16个样本（视频）。然后每个样本中随机抽取30张图片做为输入的set。

感谢你的回复，祝你五一快乐~~~

May 03 '19 10:05 Fly2flies

您好，set dimension是帧数维度，不是batch size，训练的时候这个维度就是30～

May 04 '19 03:05 AbnerHqC

您好，set dimension是帧数维度，不是batch size，训练的时候这个维度就是30～

原理是这样谢谢作者大大的指正！！！祝放假最后一天快乐！！

May 04 '19 03:05 Wei-i

GaitSet GaitSet copied to clipboard

About the set cardinality and pxk in triplet loss

GaitSet
GaitSet copied to clipboard