MMSA
MMSA copied to clipboard
关于mosi数据集中提取音视频特征维度的问题
你好,我使用原始的CMU-MultimodalSDK所提取的音频和视频特征维度分别是74和47,而这里的音频和视频特征维度分别是5和20,是更改了特征提取工具吗,还是仅仅更改了提取的特征维度,并未修改特征提取工具。在实验中需要将模态信息映射至同一维度,由于维度差别挺大,所以有这样的疑惑,是为了得到更好的特征才重新提取音视频特征吗
我也遇到了这个问题,特征维度和论文中的不太一样,但是我感觉应该是没有换提取工具,我也对较小的特征维度感到疑惑
同问