ASRT_SpeechRecognition issues

Results 112 ASRT_SpeechRecognition issues

Sort by recently updated

关于恐慌模式

（1）请问一下语言模型处为什么会出现拼音无法一次成功解码成汉字呢（2）从而使用恐慌模式的原理是什么呢希望博主可以解答下，感谢

3090训练一段时间后出现 MemoryError: bad allocation

环境搭建，改成了最新的cuda11.1 代码改成兼容 tensorflow 2.5.0-dev20201109，运行了几个小时后，出现了 MemoryError: bad allocation 环境搭建过程： https://zhuanlan.zhihu.com/p/277569990 报错： Traceback (most recent call last): File "train_mspeech.py", line 53, in ms.TrainModel(datapath, epoch = 50, batch_size = 16, save_step...

laoyin

dict.txt是哪个文件

模型训练好了，也能够测试，在自己test自己录的语音的时候，显示dataset无dict.txt文件请问这个文件是什么？在哪儿下载？ [*Info] Create Model Successful, Compiles Model Successful. Traceback (most recent call last): File "/home/gong/zyb1/ASRT/ASRT_SpeechRecognition/test.py", line 35, in r = ms.RecognizeSpeech_FromFile('dataset_test/20170001P00023A0007.wav') File "/home/gong/zyb1/ASRT/ASRT_SpeechRecognition/SpeechModel251.py", line 372, in RecognizeSpeech_FromFile r =...

1973719588

请问语言模型是如何得到的？

我看了下文档，语言模型是基于马尔科夫统计得到的，但是文档里面似乎只提供了语音模型的训练方法，没有提供语言模型的得到的方法，这个语言模型有什么方法得到吗？

zcswdt

有时能输出拼音不能输出文字

您好，我已经训练了3万条语音，然后使用了您的test.py对自己的语音进行测试。出现的问题如下：有的语音能够正常的既识别出拼音也能输出对应的文字。然而有的语音只能输出拼音，然而程序就一直卡在了输出拼音之后，不能输出对应的文字，但也没有报错，只是程序一直在运行，如图。（每一条语音都只有6s，是按照正常语速录音的）想请问这是什么原因呢？应该怎么解决呢？ ![QQ图片20210410162831](https://user-images.githubusercontent.com/78148627/114263997-f7135a80-9a1a-11eb-8c04-e0c46057fede.png)

gloriashy

测试问题

![image](https://user-images.githubusercontent.com/74276984/113836836-d1d6e000-97bf-11eb-8ce0-bbaaef8fda44.png) 卡在decode这个函数这边，一直在这个循环里面，有些音频会，有的音频不会，每个音频都有处理，不太清楚啥子问题 ![image](https://user-images.githubusercontent.com/74276984/113837056-0c407d00-97c0-11eb-9d42-7de6d85ab6aa.png)

weilinweilin-zhang

关于读取数据

linZlee

语音片段长度

测试的时候输入的语音片段长度时固定的吗？我使用test.py测试一个十几分钟的语音文件显示格式大小不匹配。 `Traceback (most recent call last): File "test.py", line 34, in r = ms.RecognizeSpeech_FromFile('/home/user/XiJing/XiJing (1)/音频1.wav') File "/home/user/ASRT_v0.6.1/SpeechModel251.py", line 382, in RecognizeSpeech_FromFile r = self.RecognizeSpeech(wavsignal, fs) File "/home/user/ASRT_v0.6.1/SpeechModel251.py", line 362, in...

tingxin1

测试问题

运行test_mspeech.py ![语音识别测试问题](https://user-images.githubusercontent.com/57243091/112416891-835a2800-8d61-11eb-934f-669f770538f2.png) 有童鞋遇见这种嘛

zx1097133696

用2070推理预训练模型过程中报错

E:\Anaconda3\envs\nlp\python.exe F:/99_projects/codes/ASRT_v0.6.1/SpeechModel251.py Using TensorFlow backend. E:\Anaconda3\envs\nlp\lib\site-packages\tensorflow\python\framework\dtypes.py:516: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as...

lbq779660843

ASRT_SpeechRecognition
ASRT_SpeechRecognition copied to clipboard

Metadata

关于恐慌模式

3090训练一段时间后出现 MemoryError: bad allocation

dict.txt是哪个文件

请问语言模型是如何得到的？

有时能输出拼音不能输出文字

测试问题

关于读取数据

语音片段长度

测试问题

用2070推理预训练模型过程中报错

← Metadata

Owner

Metadata

ASRT_SpeechRecognition ASRT_SpeechRecognition copied to clipboard

Metadata

← Metadata

Owner

Metadata

ASRT_SpeechRecognition
ASRT_SpeechRecognition copied to clipboard