StaryLan
StaryLan
Librosa 更新到 0.10.0+ 时,位置参数需要修改为关键字参数,且不影响 Libsora=0.9.2 时运行。 否则会出现 ``` TypeError: load() takes 1 positional argument but 3 positional arguments (and 2 keyword-only arguments) were given ```
简要内容 (太长不看版): 1. 重构 ASR 工具, 保留原有功能, 新增识别单文件, 适配 CPU, 并提供更详细的输出信息; 2. 调整 ASR 工具的加载时点和顺序; 3. 调整 WebUI 界面 ASR 部分的布局. 4. WebUI 运行 ASR 前对输入路径和输出路径进行 os.path.normpath, 去掉多余的分隔符, 修复 #481...
1. 启用 batch_size 交互 (interactive=True) 2. 启动时以 g_batch=10 创建界面, 所以界面固定十行, 注释掉 reload_data 函数和 b_change_index 函数中对全局变量 g_batch 的修改, 否则会出错. 修改之后可正常调整界面左下角 batch_size 滑动条使得每页显示多少条数据, 多余为空行. 3. 是否考虑动态加载每页行数, 而不是固定十行?
修改记录: 1. 调整界面布局: - 调整了语音切分工具的布局和文本; - 调整了语音识别工具的按钮大小和文本; - 对语音降噪以及后续进行重编号 (降噪 0bb→0c); - 将 uvr5 webui 和打标webui 从 checkbox 启动修改为 button 启动让界面保持一致; 2. 提升代码可读性: - 将 0a~0e 相应的启动和关闭按钮代码按顺序重排; - 按钮 click...
问题描述: #955 问题定位:faster whisper 用 glob 进行文件匹配,路径含特殊字符时未进行转义,导致无法遍历音频文件. 解决方案:换成 FunASR 使用的 `os.listdir`. 其他: - [x] 和 FunASR 函数的代码进行对齐。 - [x] 去掉无效 import
**Is this PR adding new feature or fix a BUG?** > [!NOTE] > This PR modified `fish_speech/webui/manage.py` to improve the user experience when setting the inference models. > 这一 PR...
> [!CAUTION] > 修复 Issue #1419 报告的问题,避免选择 Whisper 遇到中文时 FunASR 转写成粤语. > - [ ] 待定: Whipser 识别粤语时是否需要转 FunASR. > [!NOTE] > - 调整 FunASR 文件的逻辑, 将模型创建单独写成一个函数 `create_model()`; > -...