邱威
邱威
torch转mnn,好像这些算子还不支持,有没有计划?
一个4-5分钟的音频,在cpu上推理大概40-50分钟出结果,在GPU上大概2-3秒,这个参赛实时率是怎么算的 cpu信息: Architecture: x86_64 CPU op-mode(s): 32-bit, 64-bit Byte Order: Little Endian CPU(s): 48 On-line CPU(s) list: 0-47 Thread(s) per core: 2 Core(s) per socket: 12 座: 2 NUMA 节点:...
我基于作者提供的底模,目前还没有训练出比较正常效果的模型,说话总是很奇怪,总有些字咬字不清或者说话很含糊
有对语音识别解码感兴趣的,可以在下方讨论