face-cluster-by-infomap
face-cluster-by-infomap copied to clipboard
Over clusters
嗨,跑了infomap在part1_test结果, 但是聚类结果类别数是19276 但是真实类别是8573类。为啥会有这么大的类别差异呢
嗨,跑了infomap在part1_test结果, 但是聚类结果类别数是19276 但是真实类别是8573类。为啥会有这么大的类别差异呢
有很多孤立点,有8000多个,可以对孤立点进行二次聚类比如归入与它最相近点的的类别中去。
问下n值一般怎么取,我看原paper中在MS-Celeb-1M实验,(MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.),k取得80和每个id数量差不太多,但是deepfashion实验里面取得5,但是我看你在infomap里面k取得400。
问下n值一般怎么取,我看原paper中在MS-Celeb-1M实验,(MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.),k取得80和每个id数量差不太多,但是deepfashion实验里面取得5,但是我看你在infomap里面k取得400。
Infomap是尽量把满足相似度阈值的边都链接起来。本代码中的k值只是为了用faiss快速构建knn,k并不是infomap的一个参数。根据实际数据情况调整即可。
问下n值一般怎么取,我看原paper中在MS-Celeb-1M实验,(MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.),k取得80和每个id数量差不太多,但是deepfashion实验里面取得5,但是我看你在infomap里面k取得400。
Infomap是尽量把满足相似度阈值的边都链接起来。本代码中的k值只是为了用faiss快速构建knn,k并不是infomap的一个参数。根据实际数据情况调整即可。
哈喽,请问下GCN-V和GCN-E paper里面100w以上的数据实验是怎么跑的,一个GPU直接OOM了。。