Speech-to-Text-Russian
Speech-to-Text-Russian copied to clipboard
Вопрос по моделям
Сергей, приветствую!
Не приходилось ли использовать русскую модель отличную от версии 0.6 ? Я пробовал подменить файлы модели от 0.10 (https://alphacephei.com/vosk/models/vosk-model-ru-0.10.zip) и даже от 0.7 (https://alphacephei.com/kaldi/kaldi-ru-0.7.tar.gz ), но как-то безрезультатно. При замене файлов моделью версии 0.7 выдает
Expected token </GeneralDropoutComponent>", got instead "<SpecAugmentMaxProportion>
Возможно это связано с устаревшей версией Kaldi использованной в образе? Не приходилось ли сталкиваться, есть какие-то идеи ?
Заранее благодарю за ответ!
Не пробовал. На новогодние праздники займусь обновлением модели.
FYI: Обновил базовый образ pykaldi/pykaldi в Docker, пересобрал контейнер. Подсунул модель версии 0.10. Все пути откорректировал, чтобы находило. Настройки конфигов оставил предыдущие. Ошибок с токенами больше нету. Но в процессе распознавания появляются такие ошибки: `ERROR ([5.5.201~1-7d4bd]:CheckComputationDebugInfo():nnet-analyze.cc:1102) Debug info for matrix m2 has wrong num-rows. ERROR ([5.5.201~1-7d4bd]:CheckComputationDebugInfo():nnet-analyze.cc:1102) Debug info for matrix m2 has wrong num-rows. ERROR (ivector-extract-online2[5.5.201~1-7d4bd]:Write():kaldi-matrix.cc:1409) Failed to write matrix to stream
[ Stack-Trace: ]
kaldi::MessageLogger::HandleMessage(kaldi::LogMessageEnvelope const&, char const*)
kaldi::FatalMessageLogger::~FatalMessageLogger()
kaldi::MatrixBase
Пока решения не нашел.