Self-MM icon indicating copy to clipboard operation
Self-MM copied to clipboard

视频音频特征提取

Open ingtaoLi opened this issue 2 years ago • 2 comments

我刚刚读到了您在 AAAI 2021 上发表的精彩论文,题为“Learning Modality-Specific Representations with Self-Supervised Multi-Task Learning for Multimodal Sentiment Analysis”。我想请问一下您,在论文中您并未阐述视频音频特征提取具体使用的是什么,您方便告知一下吗?视频模块使用的是MediaPipe还是OpenFace?音频模块使用的是Librosa、OpenSMILE还是Wav2Vec呢? 抱歉耽误您的时间了,期待您的回复!谢谢!

ingtaoLi avatar Dec 02 '23 09:12 ingtaoLi

您好,请问有结果了吗

20184490 avatar Jan 22 '24 11:01 20184490

是写的OpenFace吧

YangDargon avatar Mar 08 '24 05:03 YangDargon