ZebangCheng
ZebangCheng
我从hugging face上下载了MER2023数据集: ``` /data/czb/big_space/data/MERChallenge/MER2023$ ls calc_hash.sh 'mer2023test1&2.zip' mer2023train.z01 mer2023train.z03 mer2023train.z05 mer2023train.zip README.md MER2023.png mer2023train_unzip mer2023train.z02 mer2023train.z04 mer2023train.z06 README_AFTER_APPROVAL test-labels.zip ``` 当我使用unzip命令时,显示解压失败。 请使用7z进行解压: ``` /data/czb/big_space/data/MERChallenge/MER2023$ 7z x mer2023train.zip -o./mer2023train_unzip 7-Zip [64]...
你的路径应该错了,请仔细检查文件名是**project_emotion-LLaMA**吗: '/home/cyq/project/project_emotion-LLaMA/datasets/Emotion/MER2023/mae_340_UTT/samplenew_00036945.npy' 应该修改为: '/home/cyq/project/Emotion-LLaMA/datasets/Emotion/MER2023/mae_340_UTT/samplenew_00036945.npy'
> 我已经检查了我的路径,路径是正确的,我在Google driver中重新下载了文件,但是根据粗粒度标注文档,我无法在video文件夹中找到对应id的视频文件,并且在训练过程中也频繁报错。我想知道video文件夹中的内容是直接存放视频还是子文件夹。如下图所示。谢谢 > > 我们是把所有视频都放在video文件目录。即video文件夹中的内容是直接存放视频。但是这个视频的存储是很灵活的,你只需要简单的修改视频读取代码,添加不同子文件夹的文件名就可以找到你现在文件目录结构中的视频。
> 例如在MERR_coarse_grained.txt文档中有id为sample_00006715,但是在特征文件中既存在sample_00006715,又存在samplenew_00006715;并且在vedio文件夹中仅在samplenew_00006715的视频。因此在预训练过程中会出现找不到sample_0006715视频文件的报错。请问该如何解决 首先,sample_00006715和samplenew_00006715是两个样本,完全没有管理。只是数据集官方在数据标注时巧合标注名字类似的样本。 然后,你现在核心的问题的就是文件里面检查有视频,但是运行代码提示“sample_0006715视频文件的报错”那就是你文件路径写错了。请你在加载数据相关代码之前print一些,看看实际要加载的视频路径是什么,然后再去对应的文件下检查是否存在对应的视频。
可以通过MER2023数据集官方提供hash值进行检验下载的压缩包文件是否正确: > sha256sum mer2023train.z* mer2023train.zip mer2023test1&2.zip test-labels.zip ``` 74cf8c0093543d068c78f1d8829ecadddfe2a381185ce290f9f2cecacc131afd mer2023test1&2.zip 57cc39043f5c5e8169f58ae43662955b47f28f37d8bf4393525b739c4c03a7a4 mer2023train.zip a3ad0518053b31e7b1f53bc659652fdacaea1ef34224516d384833888effc8fe test-labels.zip adb58496783306fd1b075db1944ee380b014be0b716c949affbc97133e697b19 mer2023train.z01 34e82004029c6cbdacc958395f4a95a39907f4d454f4ed65bef3261c77a11697 mer2023train.z02 321eb3a2749cf1fb7622a27e577af5615e60812021c25e93a5fb078a5c147394 mer2023train.z03 4045d89f1b4cc15677dfd53ac79a7c63a2b093e3f683e4da3030459acbecfaee mer2023train.z04 742fc19c0f9f9e4a0b663ca8ce8a187d0cb85c284f15bea04ad8d76ee5f7a9d1 mer2023train.z05 34b0523cdbf4c715ba9b7a5d18d79d2bbec0fcd391cc620f73cb11bed85ead99 mer2023train.z06 ``` 如果压缩包的hash值对不上,那就是下载的时候网络出问题了,只能重新下载。
如果只是学习项目代码,建议直接使用最后的检查点,进行测试和demo体验。后续为了提升模型性能,或者尝试创新时,可以考虑多测试不同的检查点,选择效果最好的进行后续操作。相关内容我们在其他issue上也进行讨论过,感兴趣可以查阅。 如下项目对你有帮助,可以帮忙star一下(˵¯͒〰¯͒˵)。
1.DFEW的特征已上传到Google Drive,链接如下: > https://drive.google.com/drive/folders/1LdR4qJgKQK6NrR_Hw0cdiPlAciGq1c4z?usp=sharing 2.我们用的是在多模态情绪数据集上预训练过的VideoMAE模型参数提取的特征。没有用CLIP提取特征。 3.我们使用HuBERT模型提取音频特征,没有遇到这个问题。但是将音频pad到1s,应该没影响。 4.DFEW没有提供文本的subtitle,我们是用一些ASR工具从音频中识别subtitle(虽然不完全正确)。 5.如果你们要测emotion-llama执行zero-shot的分数话,建议特征和prompt设置要和预训练的模型一致。以下是测试zero-shot分数用到的特征: `HL-UTT,maeV_399_UTT,mae_340_UTT`
I have checked, and files like `Emotion-LLaMA.pth` and `log.txt` are included in the shared Google Drive link. Please describe the specific issue you encountered while downloading, or try checking the...
Hi! Thank you for your thoughtful question and for your interest in Emotion-LLaMA! **MiniGPT-v2** is a powerful foundation multimodal model capable of interpreting visual inputs to answer questions. **Emotion-LLaMA builds...
The MERR dataset is curated from the unlabeled video samples of the MER2023 dataset. The [MERR ](https://drive.google.com/drive/folders/1LSYMq2G-TaLof5xppyXcIuWiSN0ODwqG?usp=drive_link) dataset includes only the annotations, not the original videos. If you need the...