FireRedASR icon indicating copy to clipboard operation
FireRedASR copied to clipboard

pcm文件处理

Open Spadger-dev opened this issue 8 months ago • 3 comments

pcm文件做transcribe,是不是只能先转成wav文件。请问有其他方法吗

Spadger-dev avatar Apr 24 '25 02:04 Spadger-dev

目前默认只支持wav。可以搜索一下在python里直接读取pcm文件,略微修改一下speech2text.py就行。或者搜一下ffmpeg把pcm转成wav。

FireRedTeam avatar Apr 27 '25 05:04 FireRedTeam

请问,是否也不支持字节流输入?不使用文件

目前默认只支持wav。可以搜索一下在python里直接读取pcm文件,略微修改一下speech2text.py就行。或者搜一下ffmpeg把pcm转成wav。

Spadger-dev avatar Apr 28 '25 02:04 Spadger-dev

请问,是否也不支持字节流输入?不使用文件

目前默认只支持wav。可以搜索一下在python里直接读取pcm文件,略微修改一下speech2text.py就行。或者搜一下ffmpeg把pcm转成wav。

同问,不支持字节流的话比较麻烦,每次处理都要写到文件,会产生很多临时文件。希望能支持字节流(内存数据)的处理。

steven8274 avatar Jul 08 '25 02:07 steven8274