MTCNN-Tensorflow
MTCNN-Tensorflow copied to clipboard
Reproduce MTCNN using Tensorflow
利用 MTCNN 对人脸图像进行预处理,从而得到人脸图像的 Landmark 文件。其中,我们选择五个人脸关键点,即“左眼,右眼,鼻尖,左嘴角,右嘴角” 这一步在很多论文里都有,但是具体是怎么处理生成的呢? 利用MTCNN对数据库的landmark的处理 关于MTCNN我已经自己训练过了,是最后onet生成的landmark.txt文件吗? 还是要如何使用MTCNN生成RAF数据库以及其他数据库的landmark是怎么生成的呢? 有没有大佬知道解答一下呀?
你好,在运行gen_PNet_tfrecords是报错 Traceback (most recent call last): File "D:/github/MTCNN-Tensorflow-master/prepare_data/gen_PNet_tfrecords.py", line 131, in run(dir, net, output_directory, shuffling=True) File "D:/github/MTCNN-Tensorflow-master/prepare_data/gen_PNet_tfrecords.py", line 66, in run _add_to_tfrecord(filename, image_example, tfrecord_writer) File "D:/github/MTCNN-Tensorflow-master/prepare_data/gen_PNet_tfrecords.py", line 25, in _add_to_tfrecord...
运行gen_PNet_tfrecords.py 报错:AttributeError: 'NoneType' object has no attribute 'tostring'。 检查是不是有些代码需要改成tf.compat.v1。若依旧报错,可能是第一步运行gen_12net_data.py文件不完整或者出错 (运行get_12net的这个程序,能够跑通但是在2400到2500之间这一部分的图片是无法生成数据的)
Somebody help me? I have a problem when im run train_pnet.py.  
I want to train the pre-trained model with my own dataset. I found the 'train.py' and try to restore the pre-trained model as: if net =='PNet': saver = tf.train.import_meta_graph(r'./data/MTCNN_model/PNet_landmark/PNet-2.meta') saver.restore(sess,...
目前我使用自己的标定数据完成了mtcnn的训练,发现模型的检测效果比较查,测试准确度为85%。然后发现很多人脸图片在rnet中无法检测出来。 此时,我拿出了七千张的测试数据来进行pnet的召回率计算,结果不太理想,只有85%左右。想问下,如何来提高召回的效果呢?以及提高效果后,又该如何来提高rnet的检测效果呢? 详情如下: ``` recall 1) 84% iou: 0.65 thresh: 0.6 2) 86% iou: 0.65 thresh: 0.5 ``` 我召回率的计算是: 1) 对人脸图片进行推理得到bbox 2) bbox与人脸图片对应的gt框进行iou计算,得到每个人脸bbox对应最大iou结果 3) 计算iou结果中大于阈值的框数与并与gt框数相除
目前是使用自己的数据集训练,然后在pnet上的召回是94.7%, 但是到了rnet的召回只有85%。 想问下rnet召回率低的情况下如何来进行改进呢?
你好,我在增加人脸关键点(原先5个,现在增加到64个)数据来进行模型训练,原先5个关键点时landmark_loss的曲线会衰减收敛,但是64个关键点时landmark_loss的曲线只会上下浮动不衰减。想请问这可能是由于什么情况引起?谢谢!!!
您好,我在用您的网络,将landmark改为68点时,为RNet生成bbx的过程耗时严重增加: 1 out of 1000 images done 0.025541 seconds for each image 2 out of 1000 images done 187.113974 seconds for each image 3 out of 1000 images done 205.598158...
在第11和12步产生了4个文件 pos/part/neg/landmark;而gen_imglist_onet 将4个文件合在一起 生成了一个文件train_onet_landmark;因此一共有5个文件; 但是又说生成tfrecord的时候写需要运行四次,那这四次运行输入的是item是哪4个? gen_imglist_onet的意义是啥呢? @AITTSMD