tensorflow-yolov3 icon indicating copy to clipboard operation
tensorflow-yolov3 copied to clipboard

Box-Clustering.ipynb聚类后得到的聚类中心和basline_anchors中anchor box的关系是什么?

Open changfanfan opened this issue 5 years ago • 15 comments

这是Box-Clustering.ipynb聚类后得到的聚类中心值 [[0.0627878 0.09495271] [0.11484864 0.23439993] [0.86874759 0.87105803] [0.79309616 0.46284657] [0.29627503 0.71413459] [0.41545661 0.44281255] [0.30121263 0.2348154 ] [0.1761251 0.47797277] [0.52819415 0.79192799]] 这是baseline_chors.txt的值 1.25,1.625, 2.0,3.75, 4.125,2.875, 1.875,3.8125, 3.875,2.8125, 3.6875,7.4375, 3.625,2.8125, 4.875,6.1875, 11.65625,10.1875

不清楚这两个的关系是什么?

输入的图片的宽高是不确定的

那么这两者到底什么关系

changfanfan avatar Nov 01 '19 09:11 changfanfan

前者是归一化的wh,后者是在COCO数据集上按照三个尺度的缩放倍数得到的wh

YunYang1994 avatar Nov 01 '19 11:11 YunYang1994

@YunYang1994 谢谢 basline_anchors.txt是voc2012数据集得到的wh 三个尺度缩放是什么意思?谢谢前辈了,想知道怎么从聚类后的聚类中心wh到basline_anchors.txt的 voc2012输入图像的尺寸是= [320, 352, 384, 416, 448, 480, 512, 544, 576, 608]。 尺寸是不固定的 那么聚类后的wh乘以尺寸中哪个才能得到baslin_anchors.txt的内容? 不理解从聚类归一化的wh怎么到basline_anchors中anchor _box的wh的 这块有点蒙,谢谢你了,嘻嘻。

changfanfan avatar Nov 01 '19 11:11 changfanfan

不管你输入的尺寸是多少,只要将anchor的w,h归一化就好。因为anchor的w,h是来自数据集的,与网络的输入尺寸没有半毛钱关系。

basline_anchors.txt 是在COCO数据集上得到的归一化anchor再乘以缩放倍数(分别是8,16,32)得到的.

YunYang1994 avatar Nov 02 '19 02:11 YunYang1994

我想问一下是怎么分别乘起来的?我如果乘以32,感觉结果差不多,可以说具体一点吗?还有,basline_anchors.txt中的数据顺序对结果有影响吗

Weipeilang avatar Nov 02 '19 06:11 Weipeilang

@YunYang1994 非常感谢你的回答,谢谢 我明白了其实就是个缩放问题 但疑惑点如上面的同学,是怎么分别乘起来的? 实在不好意思麻烦你了,很感谢你能在百忙中抽出时间解答我的疑问 可否给出一个从coco数据集聚类后的anchor box的wh 到basline_anchor中wh,具体的一个例子 非常感谢 你的代码写的很好,最近在学习你的代码,受益良多

@Weipeilang basline_anchor.txt中的顺序分别是9聚类中心的wh。我认为顺序是有影响的。

changfanfan avatar Nov 02 '19 07:11 changfanfan

今天终于明白了,谢谢前辈

changfanfan avatar Nov 04 '19 13:11 changfanfan

这是Box-Clustering.ipynb聚类后得到的聚类中心值 [[0.0627878 0.09495271] [0.11484864 0.23439993] [0.86874759 0.87105803] [0.79309616 0.46284657] [0.29627503 0.71413459] [0.41545661 0.44281255] [0.30121263 0.2348154 ] [0.1761251 0.47797277] [0.52819415 0.79192799]] 这是baseline_chors.txt的值 1.25,1.625, 2.0,3.75, 4.125,2.875, 1.875,3.8125, 3.875,2.8125, 3.6875,7.4375, 3.625,2.8125, 4.875,6.1875, 11.65625,10.1875

不清楚这两个的关系是什么?

输入的图片的宽高是不确定的

那么这两者到底什么关系 您好,我想问一下你自己数据的聚类中心怎么产生的呢?

JwDong2019 avatar Nov 09 '19 18:11 JwDong2019

您好,请问这些归一化的w和h是通过Box-Clustering.ipynb运行得到的嘛?

hujinda avatar Nov 10 '19 13:11 hujinda

今天终于明白了,谢谢前辈

@changfanfan [[0.0627878 0.09495271] [0.11484864 0.23439993] [0.86874759 0.87105803] [0.79309616 0.46284657] [0.29627503 0.71413459] [0.41545661 0.44281255] [0.30121263 0.2348154 ] [0.1761251 0.47797277] [0.52819415 0.79192799]] 你好请问是前三个乘以8,中间三个乘以16,后面三个乘以32吗?

zhouxianming avatar Nov 16 '19 14:11 zhouxianming

是图像的尺寸分别除以8,16,32后再乘以anchor box的聚类大小得到baseline_anchors.txt的内容。具体图像尺寸大小是VOC图像尺寸,具体是什么没有细究,但原理就是这个 在你训练自己的数据集时,使用anchor box时,就按照聚类结果*图像尺寸就是anchors.txt的大小了

在 2019-11-16 22:08:42,"zhouxianming" [email protected] 写道:

今天终于明白了,谢谢前辈

@changfanfan [[0.0627878 0.09495271] [0.11484864 0.23439993] [0.86874759 0.87105803] [0.79309616 0.46284657] [0.29627503 0.71413459] [0.41545661 0.44281255] [0.30121263 0.2348154 ] [0.1761251 0.47797277] [0.52819415 0.79192799]] 你好请问是前三个乘以8,中间三个乘以16,后面三个乘以32吗?

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

changfanfan avatar Nov 20 '19 11:11 changfanfan

@YunYang1994 作者您好 请问这两个anchor文件 我在训练coco2017时应该使用哪一个呢?谢谢您!

zhishao avatar Jan 11 '20 15:01 zhishao

是图像的尺寸分别除以8,16,32后再乘以anchor box的聚类大小得到baseline_anchors.txt的内容。具体图像尺寸大小是VOC图像尺寸,具体是什么没有细究,但原理就是这个 在你训练自己的数据集时,使用anchor box时,就按照聚类结果*图像尺寸就是anchors.txt的大小了 在 2019-11-16 22:08:42,"zhouxianming" [email protected] 写道: 今天终于明白了,谢谢前辈 @changfanfan [[0.0627878 0.09495271] [0.11484864 0.23439993] [0.86874759 0.87105803] [0.79309616 0.46284657] [0.29627503 0.71413459] [0.41545661 0.44281255] [0.30121263 0.2348154 ] [0.1761251 0.47797277] [0.52819415 0.79192799]] 你好请问是前三个乘以8,中间三个乘以16,后面三个乘以32吗? — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

不是和输入的尺寸没关系吗?

wl4135 avatar Mar 23 '20 14:03 wl4135

@changfanfan @YunYang1994 请问一下,如果想要在一个新的数据库上训练的话,是应该先用 k-means 进行归一化,生成归一化的 anchor boxes,然后再分别乘以8,16,32,然后放大后的 anchor boxes 文件进行训练吗?

ylqi007 avatar Oct 14 '20 05:10 ylqi007

@ylqi007 好像是,过去一年多了已经记不大清了

一年前我对这个仓库的代码逐行注释了 https://gitee.com/changfanfan/tensorflow-yolov3-cast 感兴趣你看看

changfanfan avatar Oct 14 '20 06:10 changfanfan

@ylqi007 好像是,过去一年多了已经记不大清了

一年前我对这个仓库的代码逐行注释了 https://gitee.com/changfanfan/tensorflow-yolov3-cast 感兴趣你看看

thank you very much!!

TakasuRyuji avatar Oct 26 '20 10:10 TakasuRyuji