GaitSet icon indicating copy to clipboard operation
GaitSet copied to clipboard

About the set cardinality and pxk in triplet loss

Open Fly2flies opened this issue 5 years ago • 8 comments

你好,非常感谢你分享那么优秀的工作。 而且你的代码非常清楚,对于刚入门的人很友好。 但是我想问一下 set cardinality = 30 是每个视角下取30张图片, p = 8 and k = 16 是取8个人,每个视角下取16/30张图片的意思么? 因为之前并没有接触过太多 Triplet Loss的知识。 Thanks for your reply!

Fly2flies avatar Apr 26 '19 12:04 Fly2flies

您好,p是人数,k是没人取的样本数,k=16即每人取16个样本(视频)。然后每个样本中随机抽取30张图片做为输入的set。

AbnerHqC avatar Apr 29 '19 09:04 AbnerHqC

您好,p是人数,k是没人取的样本数,k=16即每人取16个样本(视频)。然后每个样本中随机抽取30张图片做为输入的set。 作者大大您好,之前我也对这个输入的frame_num=30困扰 看了您的解释后有点明白. 我想向您确认下, (1)k=16即每人取16个样本(视频) 这句话 视频是不是指的是view 文件夹下的多个轮廓图组成为一个视频序列? 还是指的是3种步行条件下多个view一起的视频(说的有点乱) (2)p=8 应该指的是 subject 受试者 (也就是124个?)

Wei-i avatar May 03 '19 04:05 Wei-i

是的,多个轮廓图组成的视频序列~p是124个人

AbnerHqC avatar May 03 '19 07:05 AbnerHqC

是的,多个轮廓图组成的视频序列~p是124个人

谢谢作者的回复!! 我想了下那每个人的视频应该有 6个步行状态*11个view角度=66个视频总数

Wei-i avatar May 03 '19 08:05 Wei-i

是的,多个轮廓图组成的视频序列~p是124个人

作者大大我还想再问下关于输入的问题Xi 有以下四个维度: "set dimension, image channel dimension,image hight dimension, and image width dimension" 我想问下这个四个维度就是普通的(N,C,H,W)吗 (1) N是batch_size的数量? (2) channel就是 图像的通道数吗(我浅薄的理解是 whd的d)? 我看到您的代码中Gaitset.py也有出现过"N,C,H,W=gl.size()" 但我的老师和我说 N和C可能不是这个意思 我有点疑惑 希望作者大大在有空的时候指点一下 这4维的输入 谢谢!

Wei-i avatar May 03 '19 08:05 Wei-i

您好,p是人数,k是没人取的样本数,k=16即每人取16个样本(视频)。然后每个样本中随机抽取30张图片做为输入的set。

感谢你的回复,祝你五一快乐~~~

Fly2flies avatar May 03 '19 10:05 Fly2flies

您好,set dimension是帧数维度,不是batch size,训练的时候这个维度就是30~

AbnerHqC avatar May 04 '19 03:05 AbnerHqC

您好,set dimension是帧数维度,不是batch size,训练的时候这个维度就是30~

原理是这样 谢谢作者大大的指正!!! 祝放假最后一天快乐!!

Wei-i avatar May 04 '19 03:05 Wei-i