v3ucn

Results 21 issues of v3ucn

博客Title:刘悦的技术博客 博客地址:https://v3u.cn RSS聚合地址:https://v3u.cn/sitemap.xml 博主微博地址(选填): 博主twitter地址(选填):https://twitter.com/huangyeqiusheng

通过传入实例化模型对象,从而支持在推理过程中定制化语言模型,从而为将来的阿里ASR中日英三语转写做扩展

添加音频降噪功能,去除电音和杂音

添加 faster whisper 转写多种语言的入口和相关脚本,提高效率

添加引导音频转写功能

添加数据预处理环节的音频降噪功能,提高模型性能

添加参考音频索引下拉列表功能

添加手动语义字幕语音切分工具(多角色)

增加参考音频和文本自动填充,根据模型选择三级联动

修改显卡设备编号循环读取的bug,导致首次循环报错