v3ucn
v3ucn
博客Title:刘悦的技术博客 博客地址:https://v3u.cn RSS聚合地址:https://v3u.cn/sitemap.xml 博主微博地址(选填): 博主twitter地址(选填):https://twitter.com/huangyeqiusheng
通过传入实例化模型对象,从而支持在推理过程中定制化语言模型,从而为将来的阿里ASR中日英三语转写做扩展
添加音频降噪功能,去除电音和杂音
添加 faster whisper 转写多种语言的入口和相关脚本,提高效率
添加引导音频转写功能
添加数据预处理环节的音频降噪功能,提高模型性能
添加参考音频索引下拉列表功能
添加手动语义字幕语音切分工具(多角色)
增加参考音频和文本自动填充,根据模型选择三级联动
修改显卡设备编号循环读取的bug,导致首次循环报错