wenkeyu
                                            wenkeyu
                                        
                                    非常感谢您的关注。 (1)首先对于公式(9),graph的构建有两个必然要素——即节点nodes以及边edges,公式(9)即是计算边的公式。这部分在代码中是隐式的而不是显示的,因为在graph attention的构建中(公式(2)、(3)),用于计算两个节点相似度时已完成了对边edge的计算。此部分在代码中体现在GAT.py中Multihead attention的部分(44行)。 对于公式(10),相关部分位于model.py中251行img_emb_orig = self.gat_2(self.img_enc(images)),或者model_bert.py中224行img_emb_orig = self.gat_1(self.img_enc(images_orig))。 (2)在mscoco实验中,batch_size=300时使用一张NVIDIA 1080Ti显卡(11gb显存),或者一张TITAN XP显卡(12gb显存)。 (3)对于ResNet152的部分,在我的网络中他的参数是被固定的,不参与训练,只用于全局特征的提取,因此不会占用较多. Thank you very much for your attention. (1) First of all, for formula (9), the construction of...
这部分就是一些feed-forward-network的操作
这个我没有用到,直接使用的VSE++的vocab文件
使用的同样的测试集,即5k张图片和25k条句子。分为5折交叉测试以及全部一起测试。 您提到的函数中。测试时图片为了和文本对齐,扩充成了25000张(每5张是一样的),每次测试1k张,比如说第一个1k就是下标0-4999的5k张每隔5张取一张,即: img_emb_new = img_embs[i * 5000 : int(i * 5000 + img_embs.size(0)/5):5]
> Why did this happen? I just follow the instructions from ios/ReadME.md
Does that mean I can't run build.py for ios/android on Mac with intel cpu?
> @kywen1119 You can definitely run `build.py` no matter it's an Intel or ARM macbook without problem, but I will need more details to help you with your case. Could...
> ``` > Target configured: metal -keys=metal,gpu -libs=iphoneos -max_function_args=31 -max_num_threads=256 -max_shared_memory_per_block=32768 -max_threads_per_block=256 -thread_warp_size=1 > ``` > > Just wanted to double check, are you compiling for Android or iOS? The...
> @kywen1119 The reason is that our quantization system currently assumes the ARM CPU is used on macOS: > > https://github.com/mlc-ai/mlc-llm/blob/8f1386fe5aeb4342e0d7287863a3b7b2a072ed13/mlc_llm/utils.py#L372 > > This assumption is definitely unnecessarily strong. To...
https://github.com/kywen1119/DSRAN/blob/main/model.py#L221