视频音频特征提取

Open ingtaoLi opened this issue 2 years ago • 2 comments

我刚刚读到了您在 AAAI 2021 上发表的精彩论文，题为“Learning Modality-Specific Representations with Self-Supervised Multi-Task Learning for Multimodal Sentiment Analysis”。我想请问一下您，在论文中您并未阐述视频音频特征提取具体使用的是什么，您方便告知一下吗？视频模块使用的是MediaPipe还是OpenFace？音频模块使用的是Librosa、OpenSMILE还是Wav2Vec呢？抱歉耽误您的时间了，期待您的回复！谢谢！

Dec 02 '23 09:12 ingtaoLi

您好，请问有结果了吗

Jan 22 '24 11:01 20184490

是写的OpenFace吧

Mar 08 '24 05:03 YangDargon