face-cluster-by-infomap Over clusters

Over clusters

Open Youskrpig opened this issue 3 years ago • 4 comments

嗨，跑了infomap在part1_test结果, 但是聚类结果类别数是19276 但是真实类别是8573类。为啥会有这么大的类别差异呢

Nov 26 '20 03:11 Youskrpig

嗨，跑了infomap在part1_test结果, 但是聚类结果类别数是19276 但是真实类别是8573类。为啥会有这么大的类别差异呢

有很多孤立点，有8000多个，可以对孤立点进行二次聚类比如归入与它最相近点的的类别中去。

Nov 26 '20 03:11 xiaoxiong74

问下n值一般怎么取，我看原paper中在MS-Celeb-1M实验，（MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.），k取得80和每个id数量差不太多，但是deepfashion实验里面取得5，但是我看你在infomap里面k取得400。

Nov 26 '20 03:11 Youskrpig

问下n值一般怎么取，我看原paper中在MS-Celeb-1M实验，（MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.），k取得80和每个id数量差不太多，但是deepfashion实验里面取得5，但是我看你在infomap里面k取得400。

Infomap是尽量把满足相似度阈值的边都链接起来。本代码中的k值只是为了用faiss快速构建knn，k并不是infomap的一个参数。根据实际数据情况调整即可。

Nov 26 '20 05:11 xiaoxiong74

问下n值一般怎么取，我看原paper中在MS-Celeb-1M实验，（MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.），k取得80和每个id数量差不太多，但是deepfashion实验里面取得5，但是我看你在infomap里面k取得400。

Infomap是尽量把满足相似度阈值的边都链接起来。本代码中的k值只是为了用faiss快速构建knn，k并不是infomap的一个参数。根据实际数据情况调整即可。

哈喽，请问下GCN-V和GCN-E paper里面100w以上的数据实验是怎么跑的，一个GPU直接OOM了。。

Dec 10 '20 07:12 Youskrpig

face-cluster-by-infomap face-cluster-by-infomap copied to clipboard

Over clusters

face-cluster-by-infomap
face-cluster-by-infomap copied to clipboard