GaitSet
GaitSet copied to clipboard
About the set cardinality and pxk in triplet loss
你好,非常感谢你分享那么优秀的工作。
而且你的代码非常清楚,对于刚入门的人很友好。
但是我想问一下 set cardinality = 30
是每个视角下取30张图片,
p = 8 and k = 16
是取8个人,每个视角下取16/30张图片的意思么?
因为之前并没有接触过太多 Triplet Loss
的知识。
Thanks for your reply!
您好,p是人数,k是没人取的样本数,k=16即每人取16个样本(视频)。然后每个样本中随机抽取30张图片做为输入的set。
您好,p是人数,k是没人取的样本数,k=16即每人取16个样本(视频)。然后每个样本中随机抽取30张图片做为输入的set。 作者大大您好,之前我也对这个输入的frame_num=30困扰 看了您的解释后有点明白. 我想向您确认下, (1)k=16即每人取16个样本(视频) 这句话 视频是不是指的是view 文件夹下的多个轮廓图组成为一个视频序列? 还是指的是3种步行条件下多个view一起的视频(说的有点乱) (2)p=8 应该指的是 subject 受试者 (也就是124个?)
是的,多个轮廓图组成的视频序列~p是124个人
是的,多个轮廓图组成的视频序列~p是124个人
谢谢作者的回复!! 我想了下那每个人的视频应该有 6个步行状态*11个view角度=66个视频总数
是的,多个轮廓图组成的视频序列~p是124个人
作者大大我还想再问下关于输入的问题Xi 有以下四个维度: "set dimension, image channel dimension,image hight dimension, and image width dimension" 我想问下这个四个维度就是普通的(N,C,H,W)吗 (1) N是batch_size的数量? (2) channel就是 图像的通道数吗(我浅薄的理解是 whd的d)? 我看到您的代码中Gaitset.py也有出现过"N,C,H,W=gl.size()" 但我的老师和我说 N和C可能不是这个意思 我有点疑惑 希望作者大大在有空的时候指点一下 这4维的输入 谢谢!
您好,p是人数,k是没人取的样本数,k=16即每人取16个样本(视频)。然后每个样本中随机抽取30张图片做为输入的set。
感谢你的回复,祝你五一快乐~~~
您好,set dimension是帧数维度,不是batch size,训练的时候这个维度就是30~
您好,set dimension是帧数维度,不是batch size,训练的时候这个维度就是30~
原理是这样 谢谢作者大大的指正!!! 祝放假最后一天快乐!!