qinzirui issues

Results 1 issues of


                                            qinzirui

关于处理过的数据集的疑问

仔细地看了论文和数据集，关于三个模态的processed的数据集我有一些问题： 1. 文本模态为什么用bert模型处理后，是将每个单词表示为768个特征的向量而不是将一个句子表示？ ![image](https://github.com/thuiar/MMSA/assets/57137830/ea9e89df-3ac3-4567-9204-4768ffce7c49) 2. 还有你们的文本处理过后的数据第二维是39，意思是指你们将所有句子通过padding使得单词数量变为39吗？ ![image](https://github.com/thuiar/MMSA/assets/57137830/050ab17e-1d23-4660-82ca-40fa782451cf) 3. 同理，音频和视频模态的第二维是不是也是时间步长呢？可以告知一下音频模态的400时间步长是指采样频率为400HZ吗？视频上论文写得采样频率是30HZ，但是时间步长是55，这也是padding的结果是吧？ ![image](https://github.com/thuiar/MMSA/assets/57137830/01a35377-566d-42a9-b7a8-b471c431f220) ![image](https://github.com/thuiar/MMSA/assets/57137830/ab38fe4f-6f19-4455-ad82-8d5d10114167)