MMSA icon indicating copy to clipboard operation
MMSA copied to clipboard

关于mosi数据集中提取音视频特征维度的问题

Open Chuan76 opened this issue 10 months ago • 2 comments

你好,我使用原始的CMU-MultimodalSDK所提取的音频和视频特征维度分别是74和47,而这里的音频和视频特征维度分别是5和20,是更改了特征提取工具吗,还是仅仅更改了提取的特征维度,并未修改特征提取工具。在实验中需要将模态信息映射至同一维度,由于维度差别挺大,所以有这样的疑惑,是为了得到更好的特征才重新提取音视频特征吗

Chuan76 avatar Apr 23 '24 03:04 Chuan76

我也遇到了这个问题,特征维度和论文中的不太一样,但是我感觉应该是没有换提取工具,我也对较小的特征维度感到疑惑

hustcselwb avatar Apr 24 '24 10:04 hustcselwb

同问

Katyawa avatar Jul 24 '24 12:07 Katyawa