nl8590687
Results
94
comments of
nl8590687
请问您说的是语言模型吗?我了解了解。
好的 谢谢~ 我去了解了解
音频的最大时间长度不能长于16秒,我在项目文档中都写过的。 https://asrt.ailemon.me/docs/
因为你没有安装GPU环境
因为具有随机性
大概10左右是可以的,降不下去要手动调参
如果您有方言数据集的话您可以自行训练可识别方言的模型
看ASRT项目文档,上面有对语言模型的原理和生成的介绍
很明显,这是音频文件的时间长度过长导致的,可以参考ASRT项目文档上所述的内容,一条语音数据的最长时间长度当前限制为不能超过16秒,超过的话很容易导致模型的数据尺寸过大进而引发Memory不足的问题,尤其是在使用不太先进的GPU运行的时候。如果存在较长时间的音频,首先应当切割为一段段比较短的音频片段。
可以看下ASRT项目文档中关于Windows客户端demo的内容