Speech-Emotion-Recognition
Speech-Emotion-Recognition copied to clipboard
Speech emotion recognition implemented in Keras (LSTM, CNN, SVM, MLP) | 语音情感识别
mfcc_data.append([file, features, config.class_labels.index(label)]) 配置文件修改为二分类,标签名字改了,运行preprocess.py文件,出现这个错误。 请问这个怎么解决
运行preprocess.py文件时报错,想问一下各位大佬,这个怎么解决
您好,想请教一下在运行python preprocess.py --config configs/lstm.yaml时,出现以下错误: (MSG) [2] SMILExtract: openSMILE starting! (MSG) [2] SMILExtract: config file is: D:\Pycharm\code\Speech-Emotion\Speech-Emotion-Recognition-master\opensmile-3.0-win-x64\config\IS10_paraling.conf (MSG) [2] cComponentManager: successfully registered 103 component types. (ERR) [1] configManager: cFileConfigReader::openInput : cannot...
Bumps [numpy](https://github.com/numpy/numpy) from 1.21.5 to 1.22.0. Release notes Sourced from numpy's releases. v1.22.0 NumPy 1.22.0 Release Notes NumPy 1.22.0 is a big release featuring the work of 153 contributors spread...
Bumps [tensorflow](https://github.com/tensorflow/tensorflow) from 2.8.0 to 2.8.1. Release notes Sourced from tensorflow's releases. TensorFlow 2.8.1 Release 2.8.1 This releases introduces several vulnerability fixes: Fixes a code injection in saved_model_cli (CVE-2022-29216) Fixes...
使用其他音频测试时,会出现: Opensmile extracting... Opensmile cmd: cd D:\project\Speech-Emotion-Recognition-master3\opensmile-3.0\bin && SMILExtract -C D:\project\Speech-Emotion-Recognition-master3\opensmile-3.0\config\is09-13\IS10_parali ng.conf -I D:/project/Speech-Emotion-Recognition-master1/datasets/CASIA/angry/202-angry-zhaoquanyin.wav -O D:\project\Speech-Emotion-Recognition-master3\features\6-category\opensmile_casi a\single_feature.csv -appendarff 0 (MSG) [2] SMILExtract: openSMILE starting! (MSG) [2] SMILExtract: config file is:...
最近在学习语音情感分析的相关知识,前段时间一直在配置这个模型,目前已完成语音特征提取。 遇到的问题: (1)在运行train.py时,发现20的epochs数,每次运行的时间居然只有3ms/step。 (2)在cnn.py中, from tensorflow.python.keras.layers import Dense, Dropout, Flatten, Conv1D, Activation, BatchNormalization, MaxPooling1D 这句有报错:cannot import name 'BatchNormalization' from 'tensorflow.python.keras.layers' 关于问题(1): 我只能认为数据完全没有跑,一般来说即使用1200句的casia,也至少应该跑4个小时以上才对。所有我去对models里的py文件逐行debug, 于是有了问题(2): 没有BatchNormalization的接口。 我自己去读了tensorflow.python.keras.layers下的__init__.py文件,发现根本没有BatchNormalization的接口,只有tensorflow\python\layers(不在Keras中)中有normalization.py文件。 我自己是在豆瓣源上下载的TensorFlow2.8,其各个版本和其他源上的我都试过,都没有BatchNormalization。不知道TensorFlow2.8中BatchNormalization的位置,或者是否已删除或用其他接口代替。 个人看了一下,估计目前最大的问题就在模型的搭建上,希望了解一下大致训练多长时间,accuracy和loss在哪个范围内是正常的。还有就是您用的TensorFlow属于哪个版本,获取途径是什么。被这个折磨了快有两天多了,希望能解答一下疑惑,非常感谢。
single_feature.csv这个文件可以传一个类似的文件吗?我想知道格式是什么样的
请问在训练EMO-DB数据集时,除了在config里面的路径修改,特征集位置修改,在lstm.py里面的class_lables修改为7之外,请问还要修改其他地方吗,我这里显示这样的报错ValueError: Shapes (32, 6) and (32, 7) are incompatible,感觉是哪里的代码还需要修改,求指正,非常非常感谢!
预处理问题
为什么我路径设置好了,预处理也跑完了,最后打开csv文件是空的。 我用cmd单独处理一个音频是可以提取出csv文件的但是放在程序里跑完了一条语音特征都没提取出来