因为 macos 系统原因,我这里只能用云服务进行语音转换。 转换出来的文本,常常整篇是一大段文字。表现为:进入跟读页面后,只有一个页面(待补充图片)
这种情况下生成音标,要么出错,要么缺失
Azure AI 的效果应该是比较稳定的。你是在用 cloudflare AI 吧?
v0.2.0