chengzhengxin comments

Results 9 comments of


                                            chengzhengxin

关于模型训练

训练时的bounding box尽量在人脸检测出来的box附近随机扰动一下，也可以跟踪时使用的最小外接矩形框随机变动一下，这样对于predict时有更强的鲁棒性

直接通过图像信息回归得到2d的landmark都会抖动，包括使用CNN的方式回归得到的landmark抖动也会很严重，没有较好的解决办法，因为训练数据中人脸特征点就是存在噪声的，做不到精确到像素，故基于此得到的学习模型也会抖动。目前知道的一种方法是通过人脸3d shape信息和图像同时得到的landmark不会出现抖动的现象，具体参考浙大chen cao的Facial Animation系列paper

你好，请问estimateHeadPose2dArray这个矩阵是怎么得到的呢？

线性回归

在多人脸情况下人脸检测和对齐都出现大量误检

多人脸情况下就是只会跟踪一个最大的人脸，特征点检测效果跟几个人脸没有关系，如果需要跟踪多个人脸，需要修改源码。

why do so can get Roll, Yaw, Pitch Angles?

linear regression, MatrixA denotes facial landmarks(as a 14d vector), MatrixW(that is estimateHeadPose2dArray2) means weights(as a 14X3 matrix), then we can get angles from MatrixAngle(3d vector) = MatrixA*MatrixW;

why do so can get Roll, Yaw, Pitch Angles?

是的，可以预先通过10个三维模型，人工标定这些三位模型里面的脸部特征点，然后随机旋转平移这些特特征点，然后通过相机成像模型投影得到二维点。这样就有了二维脸部特征点到头部姿态的映射。然后线性回归。

about train code and data

代码里面都有，自己生成的，一个图片list和特征的坐标一一对应的二进制文件。

about train code and data

代码里面都是有的，用心看就好了，并未有什么特殊的格式。

how about the speed of sdm in ios

42fps on iphone 6s