ZebangCheng

Results 75 comments of ZebangCheng

推理代码指的是Demo吗?我们的推理代码输入是视频,然后从视频中提取audio,再把audio输入到HuBERT模型中提取特征。 我们的测试代码,是提前将audio输入到HuBERT模型提取特征npy文件,然后直接加载audio的特征进行测试。

https://github.com/ZebangCheng/Emotion-LLaMA/blob/20e30d68afac5b2af94e988cde50dfdec0e78e02/minigpt4/datasets/datasets/first_face.py#L177-L190

Yes, you can download the MERR dataset by clicking the link in the [**MERR Dataset**](https://github.com/ZebangCheng/Emotion-LLaMA?tab=readme-ov-file#-merr-dataset) section of the README.

> 作者您好,十分感谢您做的工作,通过您的自述文件下载的数据集可以直接用于模型预训练吗,不需要任何数据预处理了吗 我们在Google Driver上开源了相关的特征和配置文件,可以不进行任何数据预处理就可以进行复现。 但是,如果你需要 提取新的特征或者 想要尝试不同的方案,就需要 进行新的数据预处理。

是的,我们在google driver分享的内容是可以进行训练的,在训练时可能遇到的问题在别的issue里,我和其他研究者也讨论过,你可以多看看。 注意,你还需要按照教程去官网额外下载llama的官方开源权重,MiniGPT-v2的模型权重。 如果你训练遇到什么问题,可以咨询我们。

> 作者您好,我在您分享的google driver中没有找到video的文件,请问这个video是mer2023中的训练数据吗? MER2023或者其他数据的原始视频需要你去对应的数据集官网申请下载,我们没有数据集的权限,所以我们并不能分享原始的视频文件。

如果你需要重头到尾全部进行复现,那你是需要全部下载的。 如果你只是想复现我们论文中的结果,你可以只下载测试集相关内容。 为了你后续研究方便,建议还是全部下载吧。

> 作者您好,为什么我从您提供的链接中下载的数据集大小都是0,且在训练过程中无法读取,求指导 提供一下截图或者日志呢?你使用的是那个链接?想要下载的是什么?(视频还是特征) 我们没有数据的分发权限,要下载源视频只能去数据集对应的官网下载。

可以把遇到的问题描述清晰一点,这样更方便我们定位问题。 你是在hugging face上下载的吗? > https://huggingface.co/datasets/MERChallenge/MER2023 把所有文件都下载下来,一起解压试试:

MER2023数据集不是我们的工作,是一个公开数据集,我们不能上传。我这边也尝试下载一下这个数据集,看看能否正常解压。如果存在上述问题,我尝试联系一下数据集官方,解决这个问题。