Ziqi Yuan
Ziqi Yuan
您好,请问是哪条样本呢(样本id是多少),我们检查一下。
非常感谢您的反馈,如果上述问题给您带来的困惑,我们很抱歉。 这个问题是由于我们同学的疏忽,统计annotations的时候是所有标注者的少数服从多数的投票结果,而regression_labels 是去掉最高分、最低分的均值,所以导致了部分数据两种标签不一致的情况;论文中的所有实验都只是用了regression_labels,因为通常来说把情感分析当作回归任务能取得更好的效果。 我们已经更新了google drive 上的数据(调整annotations与原有regression_labels的符号保持一致),百度云盘的数据等我们论文一作(已经毕业)从新上传。 如果还有什么其他问题欢迎随时issue提出,不胜感谢。
您好,首先采样率越高(每秒采样的样本数),误差越小。将采样率设置为 8000 反而会导致更大的误差。 关于您的报错可以看看是不是能用这个解决: https://stackoverflow.com/questions/43838718/how-can-i-extract-cqt-from-audio-with-sampling-rate-8000hz-librosa 目前情感分析等问题中音频默认(通用的)采样率都是16k。
您好,感谢您关注我们组的工作。 这个不一致是由于我们工作的疏忽导致,训练样本数量应该是2721个,最终的数据集信息请参考Google 云盘、百度网盘上下载的最终版数据。(label.csv文件)
在使用 ch-sims 数据时,最直接的方法是把 head_dim 设置为1。原始配置应该是mosi的设置;
Thank you for the reminder. The update has been completed https://pan.baidu.com/s/1hBrsd5UpZ9NCKNv_xm-l1A?pwd=5rtu
@SuN1775 @Yan-cloud921 已经更新了
您好,对于 1. TETFN 在我们复现的时候并没有进行开源,我们只是根据论文尽最大可能复现得到的模型,与原论文有差异是正常的,本仓库的TETFN的复现进提供参考,有official的实现,欢迎给本仓库pull request。 2. 因为在设置中设置了 need_model_aligned=True,进行了模型CTC对齐,将原始的非对齐数据进行了CTC模型对齐,将模型对齐的数据传入了TETFN模型。
请检查 transformers 仓库的版本
@ZAE02 您好,V1_Semi和V1 是模型的版本(论文中使用的方法就是这两个),v2是数据集版本。确实有点容易混淆,不好意思