Hongguang Zhu

Results 2 issues of Hongguang Zhu

作者可以透漏一下这个实验训练测试中所需要的内存吗?还有来自VLP巨大的region feature和之前SCAN中用的pre-comp feature有什么不同,只是单纯的框数量增到100吗?我看网络流程图中检测regions是用fasterRCNN,我以为是和前人一样用的BUTD的pre-comp,实际上是用的VLP的100框对吗?这个对于效果影响大吗?可以换回之前的pre-comp吗?因为我实验环境内存有限。🤦‍♂️允悲

https://github.com/kywen1119/DSRAN/blob/630d9dc19fe47c5bd32d3b21bd934aead4b1b87b/vocab.py#L121 为什么这里是300,之前的大多设为4,occurrence高于300的词很少吧