2022-TPAMI-DCP icon indicating copy to clipboard operation
2022-TPAMI-DCP copied to clipboard

关于互信息中的信息熵系数

Open ChenyuxinXMU opened this issue 1 year ago • 2 comments

您好!我有个问题想要请教一下。 您在论文中提到,最大化互信息的损失函数中,用于调节信息熵的平衡系数lamb越高,意味着嵌入表示z中包含更丰富的信息,并且您做了相应参数实验。 我在使用您的代码运行其他数据集时,发现lamb设为0往往可以达到最好的效果,相当于删除了信息熵H这一项,这是什么原因呢?该如何解释这一现象? 期待您的解答!十分感谢!

ChenyuxinXMU avatar Mar 24 '23 04:03 ChenyuxinXMU

感谢您的关注!

更准确的来说,信息熵H(Z)度量了表征Z的不确定度。最大化H(Z)对于处理类别不平衡、长尾的数据集(caltech)有一定帮助,可以减轻小类塌缩到大类的情况。

对于不同的数据集,最优的lamb值可能不同,因为每个数据集的特征和分布都不同,Z的不确定度也不应相同。对于非常平衡的数据集,lamb的效果可能会受限。同时,lamb也应该考虑到Z的维度设置。

Lin-Yijie avatar Mar 24 '23 04:03 Lin-Yijie

感谢您的解答!但我仍然对lamb=0的情况的可解释性感到好奇,因为这关系到互信息损失函数中项的缺失。

ChenyuxinXMU avatar Mar 24 '23 05:03 ChenyuxinXMU