face-cluster-by-infomap icon indicating copy to clipboard operation
face-cluster-by-infomap copied to clipboard

Over clusters

Open Youskrpig opened this issue 3 years ago • 4 comments

嗨,跑了infomap在part1_test结果, 但是聚类结果类别数是19276 但是真实类别是8573类。为啥会有这么大的类别差异呢

Youskrpig avatar Nov 26 '20 03:11 Youskrpig

嗨,跑了infomap在part1_test结果, 但是聚类结果类别数是19276 但是真实类别是8573类。为啥会有这么大的类别差异呢

有很多孤立点,有8000多个,可以对孤立点进行二次聚类比如归入与它最相近点的的类别中去。

xiaoxiong74 avatar Nov 26 '20 03:11 xiaoxiong74

问下n值一般怎么取,我看原paper中在MS-Celeb-1M实验,(MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.),k取得80和每个id数量差不太多,但是deepfashion实验里面取得5,但是我看你在infomap里面k取得400。

Youskrpig avatar Nov 26 '20 03:11 Youskrpig

问下n值一般怎么取,我看原paper中在MS-Celeb-1M实验,(MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.),k取得80和每个id数量差不太多,但是deepfashion实验里面取得5,但是我看你在infomap里面k取得400。

Infomap是尽量把满足相似度阈值的边都链接起来。本代码中的k值只是为了用faiss快速构建knn,k并不是infomap的一个参数。根据实际数据情况调整即可。

xiaoxiong74 avatar Nov 26 '20 05:11 xiaoxiong74

问下n值一般怎么取,我看原paper中在MS-Celeb-1M实验,(MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.),k取得80和每个id数量差不太多,但是deepfashion实验里面取得5,但是我看你在infomap里面k取得400。

Infomap是尽量把满足相似度阈值的边都链接起来。本代码中的k值只是为了用faiss快速构建knn,k并不是infomap的一个参数。根据实际数据情况调整即可。

哈喽,请问下GCN-V和GCN-E paper里面100w以上的数据实验是怎么跑的,一个GPU直接OOM了。。

Youskrpig avatar Dec 10 '20 07:12 Youskrpig