箱庭XTer

Results 9 issues of 箱庭XTer

I have installed the newest onnx and onnxruntime or something. While running onnx_export.py ``` Traceback (most recent call last): File "onnx_export.py", line 74, in main(False,True) File "onnx_export.py", line 54, in...

### 推理切分 在推理的切分部分,可以使用稍微智能一点的切割方式 ``` def auto_cut(inp): # if not re.search(r'[^\w\s]', inp[-1]): # inp += '。' inp = inp.strip("\n") split_punds = r'[?!。?!~:]' if inp[-1] not in split_punds: inp+="。" items = re.split(f'({split_punds})',...

如题,当单句过长会导致爆显存 但是现在的代码没有用到split_big_text这个函数 实例: ``` 一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十 ``` 这个用现行的切分方法都会退化成不切 因此重写了split_big_text,并且添加了一个新的切分方法:基于标点凑字切 这样就可以在以大标点如句号、问号划定的基础上,以小标点如逗号为划定的单位,囊括进尽可能多的短句了

增加了一个SRT合并切分插件, 并且修改了i18n让其能读取指定的文件夹

todolist

我写了一个基于GPT-soVITS开发的 推理特化插件 请见项目:https://github.com/X-T-E-R/TTS-for-GPT-soVITS ,中文文档:https://www.yuque.com/xter/zibxlp 一切语音合成基于一个统一的API服务, 并且实现了 前后端分离、模型管理、多角色/情绪切换、流式推理等特性(未来还可以增加音素编辑、支持SSML)。 重写了一个基于api服务的前端。尤其是提供了一种傻瓜式模型分享格式与配套的编辑器,十分利好小白,并且让参考音频的切换变得相当迅速。 只需要增加一个推理子模块即可。

修改: 1. 改用`FileResponse(tmp_file_path, media_type=f"audio/{format}", filename=f"audio.{format}")`,替代原本非流式的返回,支持更多格式,速度能更快,并且会避免占线 2. 重写接口函数,避免无用代码 ``` @APP.get("/tts") @APP.post("/tts") async def tts_get_endpoint(request: Request): # 尝试从JSON中获取数据,如果不是JSON,则从查询参数中获取 if request.method == "GET": data = request.query_params else: data = await request.json() ``` 3....

GSVI (GPT-Sovits Inference) is an inference enhancement project based on GPT-Sovits, allowing you to run an API interface locally, offering emotion-rich speech-to-text and convenient model management features. https://github.com/X-T-E-R/GPT-SoVITS-Inference https://github.com/RVC-Boss/GPT-SoVITS https://github.com/X-T-E-R/TTS-for-GPT-soVITS...

🟨 PR - Medium

Hello, I recently developed a simple OCR wrapper that integrates several common OCR methods into one library. You can find it here: my-little-ocr. https://github.com/X-T-E-R/my-little-ocr I believe this project could benefit...

你好,我最近开发了一个简单的 OCR wrapper,集成了几种常见的 OCR 方法。你可以在这里找到它:[my-little-ocr](https://github.com/X-T-E-R/my-little-ocr)。 我认为这个项目可以尝试使用这个库,以避免像现在这样手动管理多个 OCR 方法。通过这个库,你可以利用其统一的接口来简化 OCR 任务的处理,也为将来的扩展提供了灵活性。 支持的 OCR 库包括:Tesseract(Apache 2.0 许可)、EasyOCR(Apache 2.0 许可)、WeChat OCR(未知许可)、Surya(GPL 3.0 许可)、RapidOCR(Apache 2.0 许可)。 欢迎查看并考虑将它集成到项目中! Hello, I recently developed a simple OCR...

enhancement