ZebangCheng comments

Results 75 comments of


                                            ZebangCheng

语音模态信息在训练过程中是否没有使用？

推理代码指的是Demo吗？我们的推理代码输入是视频，然后从视频中提取audio，再把audio输入到HuBERT模型中提取特征。我们的测试代码，是提前将audio输入到HuBERT模型提取特征npy文件，然后直接加载audio的特征进行测试。

语音模态信息在训练过程中是否没有使用？

https://github.com/ZebangCheng/Emotion-LLaMA/blob/20e30d68afac5b2af94e988cde50dfdec0e78e02/minigpt4/datasets/datasets/first_face.py#L177-L190

MERR dataset

Yes, you can download the MERR dataset by clicking the link in the [**MERR Dataset**](https://github.com/ZebangCheng/Emotion-LLaMA?tab=readme-ov-file#-merr-dataset) section of the README.

MERR dataset

> 作者您好，十分感谢您做的工作，通过您的自述文件下载的数据集可以直接用于模型预训练吗，不需要任何数据预处理了吗我们在Google Driver上开源了相关的特征和配置文件，可以不进行任何数据预处理就可以进行复现。但是，如果你需要提取新的特征或者想要尝试不同的方案，就需要进行新的数据预处理。

MERR dataset

是的，我们在google driver分享的内容是可以进行训练的，在训练时可能遇到的问题在别的issue里，我和其他研究者也讨论过，你可以多看看。注意，你还需要按照教程去官网额外下载llama的官方开源权重，MiniGPT-v2的模型权重。如果你训练遇到什么问题，可以咨询我们。

MERR dataset

> 作者您好，我在您分享的google driver中没有找到video的文件，请问这个video是mer2023中的训练数据吗？ MER2023或者其他数据的原始视频需要你去对应的数据集官网申请下载，我们没有数据集的权限，所以我们并不能分享原始的视频文件。

MERR dataset

如果你需要重头到尾全部进行复现，那你是需要全部下载的。如果你只是想复现我们论文中的结果，你可以只下载测试集相关内容。为了你后续研究方便，建议还是全部下载吧。

MERR dataset

> 作者您好，为什么我从您提供的链接中下载的数据集大小都是0，且在训练过程中无法读取，求指导提供一下截图或者日志呢？你使用的是那个链接？想要下载的是什么？（视频还是特征）我们没有数据的分发权限，要下载源视频只能去数据集对应的官网下载。

MERR dataset

可以把遇到的问题描述清晰一点，这样更方便我们定位问题。你是在hugging face上下载的吗？ > https://huggingface.co/datasets/MERChallenge/MER2023 把所有文件都下载下来，一起解压试试：

MERR dataset

MER2023数据集不是我们的工作，是一个公开数据集，我们不能上传。我这边也尝试下载一下这个数据集，看看能否正常解压。如果存在上述问题，我尝试联系一下数据集官方，解决这个问题。