chengzhengxin

Results 9 comments of chengzhengxin

训练时的bounding box尽量在人脸检测出来的box附近随机扰动一下,也可以跟踪时使用的最小外接矩形框随机变动一下,这样对于predict时有更强的鲁棒性

直接通过图像信息回归得到2d的landmark都会抖动,包括使用CNN的方式回归得到的landmark抖动也会很严重,没有较好的解决办法,因为训练数据中人脸特征点就是存在噪声的,做不到精确到像素,故基于此得到的学习模型也会抖动。目前知道的一种方法是通过人脸3d shape信息和图像同时得到的landmark不会出现抖动的现象,具体参考浙大chen cao的Facial Animation系列paper

多人脸情况下就是只会跟踪一个最大的人脸,特征点检测效果跟几个人脸没有关系,如果需要跟踪多个人脸,需要修改源码。

linear regression, MatrixA denotes facial landmarks(as a 14d vector), MatrixW(that is estimateHeadPose2dArray2) means weights(as a 14X3 matrix), then we can get angles from MatrixAngle(3d vector) = MatrixA*MatrixW;

是的,可以预先通过10个三维模型,人工标定这些三位模型里面的脸部特征点,然后随机旋转平移这些特特征点,然后通过相机成像模型投影得到二维点。这样就有了二维脸部特征点到头部姿态的映射。然后线性回归。

代码里面都有,自己生成的,一个图片list和特征的坐标一一对应的二进制文件。

代码里面都是有的,用心看就好了,并未有什么特殊的格式。