箱庭XTer

Zhejiang University Existing

Results 9 issues of


                                            箱庭XTer

onnx_export.py Error

I have installed the newest onnx and onnxruntime or something. While running onnx_export.py ``` Traceback (most recent call last): File "onnx_export.py", line 74, in main(False,True) File "onnx_export.py", line 54, in...

【建议】一些简单的改进建议附代码

### 推理切分在推理的切分部分，可以使用稍微智能一点的切割方式 ``` def auto_cut(inp): # if not re.search(r'[^\w\s]', inp[-1]): # inp += '。' inp = inp.strip("\n") split_punds = r'[?!。？！~：]' if inp[-1] not in split_punds: inp+="。" items = re.split(f'({split_punds})',...

【Fast inference 分支】有关于切分句子单句过长会出现问题，并且增加了一种新的切分方法

如题，当单句过长会导致爆显存但是现在的代码没有用到split_big_text这个函数实例： ``` 一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十一二三四五六七八九十 ``` 这个用现行的切分方法都会退化成不切因此重写了split_big_text，并且添加了一个新的切分方法：基于标点凑字切这样就可以在以大标点如句号、问号划定的基础上，以小标点如逗号为划定的单位，囊括进尽可能多的短句了

增加了一个SRT合并切分插件

增加了一个SRT合并切分插件，并且修改了i18n让其能读取指定的文件夹

todolist

Add a inferencing submodule to separately distinguish the inferencing part. 增加一个推理子模块，将推理部分单独区分出去

我写了一个基于GPT-soVITS开发的推理特化插件请见项目：https://github.com/X-T-E-R/TTS-for-GPT-soVITS ，中文文档：https://www.yuque.com/xter/zibxlp 一切语音合成基于一个统一的API服务，并且实现了前后端分离、模型管理、多角色/情绪切换、流式推理等特性（未来还可以增加音素编辑、支持SSML）。重写了一个基于api服务的前端。尤其是提供了一种傻瓜式模型分享格式与配套的编辑器，十分利好小白，并且让参考音频的切换变得相当迅速。只需要增加一个推理子模块即可。

[fast_inference_] 重构很多api_v2.py，make api great and greater again !

修改： 1. 改用`FileResponse(tmp_file_path, media_type=f"audio/{format}", filename=f"audio.{format}")`，替代原本非流式的返回，支持更多格式，速度能更快，并且会避免占线 2. 重写接口函数，避免无用代码 ``` @APP.get("/tts") @APP.post("/tts") async def tts_get_endpoint(request: Request): # 尝试从JSON中获取数据，如果不是JSON，则从查询参数中获取 if request.method == "GET": data = request.query_params else: data = await request.json() ``` 3....

Adapting a TTS API for the GSVI (GPT-SoVits Inference) Project

GSVI (GPT-Sovits Inference) is an inference enhancement project based on GPT-Sovits, allowing you to run an API interface locally, offering emotion-rich speech-to-text and convenient model management features. https://github.com/X-T-E-R/GPT-SoVITS-Inference https://github.com/RVC-Boss/GPT-SoVITS https://github.com/X-T-E-R/TTS-for-GPT-soVITS...

🟨 PR - Medium

Integration Suggestion for OCR Wrapper

Hello, I recently developed a simple OCR wrapper that integrates several common OCR methods into one library. You can find it here: my-little-ocr. https://github.com/X-T-E-R/my-little-ocr I believe this project could benefit...

Integration Suggestion for OCR Wrapper 集成 OCR Wrapper 库的建议

你好，我最近开发了一个简单的 OCR wrapper，集成了几种常见的 OCR 方法。你可以在这里找到它：[my-little-ocr](https://github.com/X-T-E-R/my-little-ocr)。我认为这个项目可以尝试使用这个库，以避免像现在这样手动管理多个 OCR 方法。通过这个库，你可以利用其统一的接口来简化 OCR 任务的处理，也为将来的扩展提供了灵活性。支持的 OCR 库包括：Tesseract（Apache 2.0 许可）、EasyOCR（Apache 2.0 许可）、WeChat OCR（未知许可）、Surya（GPL 3.0 许可）、RapidOCR（Apache 2.0 许可）。欢迎查看并考虑将它集成到项目中！ Hello, I recently developed a simple OCR...

enhancement