Deep-Alignment-Network-tensorflow some issues about data set

In TrainingSetPreparation.py, I wonder whats the format of LFPW or HELEN and how to ensure that images corresponding to data?

Mar 29 '18 08:03 Chromer163

You can google and download 300-w dataset, and see the format.

There is a .pts file with the same name of the corresponding photo, the format of the .pts file can be found in the 300-w website.

Mar 29 '18 10:03 mariolew

Thanks. In the paper, it trained 2 models: DAN and DAN-Menpo. For DAN, it used only 3148 images, so I wonder is it enough for the training of CNN? And for the first question, I found there are some boundingbox files ended with .pkl. Did you generate these files? And what I should do is to put the images and .pts in the data file?

Mar 30 '18 07:03 Chromer163

3000+ images are not enough to train the model, so DAN conduct several data augmentation techniques like random shift, rotate and mirror.

Mar 30 '18 07:03 mariolew

Ok, thanks. You are really kind.

Mar 30 '18 07:03 Chromer163

def GeneratePerturbations(self, nPerturbations, perturbations): Is this function used for data augmentation? so how many images will be augmented per image? I see in the code trainSet.GeneratePerturbations(10, [0.2, 0.2, 20, 0.25])# Does it mean 10 per images? and... Can I speak Chinese? （我能说中文不？）

Apr 03 '18 13:04 Chromer163

对的，请说中文，早该如此啦。

Apr 04 '18 07:04 mariolew

mobile net是另外加进去的吗？

Apr 07 '18 16:04 Chromer163

是的。

Apr 08 '18 00:04 mariolew

plt.savefig("../meanImg.jpg") ``TypeError: integer argument expected, got float 这个是怎么回事呢，meanImg这个矩阵的元素是int，怎么还会报错？

Apr 08 '18 09:04 Chromer163

错误信息写的是got float，说明meanImg不是int呢，你再看看?

Apr 08 '18 09:04 mariolew

meanImg的每个元素都是int,我将plt.savefig("../meanImg.jpg")改为plt.savefig("../meanImg.png")后，就生成了但是不知道为什么。此外运行trainDAN.py会报这个错：

Apr 08 '18 12:04 Chromer163

很显然，你处理数据得到的npz不叫这个名字，你得去看看你的叫什么名字，nimgs=40xxx，这个40是因数据数量而异的。

Apr 08 '18 12:04 mariolew

最近想训练这个模型，关于如何运行，是不是先分别run training\testSetPreparation.py这两个文件，生成所需要的.npz然后再去run trainDAN.py？我在运行testSetPreparation.py时，抛出一个error: Traceback (most recent call last): File "/home/huangyangguang/PycharmProjects/Deep-Alignment-Network-tensorflow-master/DAN-TF/TestSetPreparation.py", line 20, in <module> commonSet.PrepareData(commonSetImageDirs, commonSetBoundingBoxFiles, meanShape, 0, 1000, False) File "/home/huangyangguang/PycharmProjects/Deep-Alignment-Network-tensorflow-master/DAN-TF/ImageServer.py", line 60, in PrepareData boundingBoxDict = pickle.load(open(boundingBoxFiles[i], 'rb')) UnicodeDecodeError: 'ascii' codec can't decode byte 0xd3 in position 0: ordinal not in range(128)

Apr 09 '18 01:04 Chromer163

Emmm，你把commonSetBoundingBoxFiles = ["../data/boxesLFPWTest.pkl", "../data/boxesHelenTest.pkl"]里面对应的pkl改成py3开头的文件即可，我忘了改上去了，不好意思，具体你可以看看data文件夹里py3开头的文件名。

Apr 09 '18 01:04 mariolew

嗯嗯，那这两个也需要改吗？ `challengingSetImageDirs = ["../data/images/ibug/"] challengingSetBoundingBoxFiles = ["../data/boxesIBUG.pkl"]

w300SetImageDirs = ["../data/images/300W/01_Indoor/", "../data/images/300W/02_Outdoor/"] w300SetBoundingBoxFiles = ["../data/boxes300WIndoor.pkl", "../data/boxes300WOutdoor.pkl"]`

Apr 09 '18 02:04 Chromer163

都改的。

Apr 09 '18 02:04 mariolew

嗯嗯，按照你说的以后，我得到了以下文件：现在的问题是，这四个文件是test和train各两个吗？具体是怎么使用呢？比如trainDAN里面：

Apr 09 '18 02:04 Chromer163

这个就随你咯，看你需求吧。都行。

Apr 09 '18 02:04 mariolew

恩，我的理解这三个.npz文件用做验证集，然后剩下的那个作为训练集？现在的问题是感觉我生成的这个训练集里面怎么只有100个数据。。。那个 trainSet.GeneratePerturbations(10, [0.2, 0.2, 20, 0.25])#位移0.2，旋转20度，放缩+-0.25这句是用来数据扩充的吗？那么该如何使用呢？这个训练集的数据量肯定是不对的。

Apr 09 '18 03:04 Chromer163

trainset的生成代码里面有一些数字你可以修改一下，这样就不会是100了。

Apr 09 '18 04:04 mariolew

恩，我发现你把trainingSetPreparation.py中trainSet.Save(datasetDir)#保存成字典形式，key为'imgs'，'initlandmarks'，'gtlandmarks'这句给注释掉了，无法生成对应的训练集的.npz 此外我run trainDAN.py, 抛出这个错误：

Apr 09 '18 12:04 Chromer163

这个错误太奇怪了，我的mac上是不会出这种错误的，看它字面意思应该是开辟空间出错？

Apr 09 '18 12:04 mariolew

有没有可能是tensorflow版本不对？我看你使用的是1.5.0,我下载了r1.5但是我刚才看了一下居然是不知道如何找到你说的1.5.0

Apr 09 '18 12:04 Chromer163

这个不好说，要装1.5直接pip install tensorflow==1.5.0即可

Apr 09 '18 12:04 mariolew

似乎跟validation set有关，在trainDAN.py里面，送入validation set的.npz文件不能太大，我试了一下，有四个.npz文件，其中大小5～7M的都可以train，但是几十M的就会报这个错误。 (我目前没有使用GPU，等明天换到服务器上试试) 另外我有个问题想咨询一下：我现在电脑上有不同的tensorflow的GPU版本，但是要用你的1.5.0gpu版本的tensorflow，在不卸载之后版本的tensorflow情况下，如何操作？就是担心1.5.0的cuda和cudnn和我之前的不一样。

Apr 09 '18 14:04 Chromer163

cuda和cudnn可以装多个的，具体请搜索。

Apr 11 '18 00:04 mariolew

@Chromer163 跟validationset有关的话，可能是因为数据经模型前传占内存过大，你可以每次测试的时候少一些数据，因为虽然数据几十兆，但是经过网络以后就很大了。

Apr 11 '18 01:04 mariolew

Hi, 我将TrainingSetPreparation.py:13 修改为trainSet.PrepareData(imageDirs, None, meanShape, 100, 100000, True) 生成的训练数据有60960个和DeepAlignmentNetwork原始项目的训练集大小一样，gtx 1080下一次迭代5分钟，我改了batchsize=64。想咨询一下Landmark68Test函数你没有实现对吧？这个是zjjMaiMai实现的版本里的吧。有什么可视化结果的代码吗？ @mariolew

Apr 11 '18 09:04 hengshan123

@hengshanji 可视化结果就run出landmark的值来，然后画出来即可，绘图的代码与tensorflow没有关系，你用原作者的代码绘图也可以的。

Apr 11 '18 09:04 mariolew

请问一下，为什么testDAN.py运行出的每张图片的误差结果都是同一个结果啊？是什么意思呢

Apr 12 '18 07:04 THtanghuan