ELK-milu
ELK-milu
例如“信息得以更广泛”这句,生成的语音是“信息得(停顿)以更广泛”。像这样的问题在流式分割成小短句后经常出现,造成这个问题具体原因可能出现哪一步?如何能够修复?
## 变更描述 feat:为kb的download_document,add_documents,delete_document操作接口使用了minio管理文件。实现了minio的部分异步操作 debug:minio 7.2.19使用时需要显式指定参数 feat:为excel添加了特殊的处理方式,通过保存表头避免chunk丢失信息,需要安装openpyxl ## 变更类型 - [x] 新功能 - [x] Bug 修复 - [ ] 文档更新 - [ ] 其他 ## 测试 - [x] 已在 Docker 环境测试...
好久没同步主分支了,魔改了很多代码,基本就是每天提需求就爆肝改改改。 基本上sql,minio,文件io,ocr等功能已经完全用异步实现。添加了异步Redis做缓存,Celery实现定时任务,alembic管理数据库 1.添加了硅基流动的deepseekOCR提取markdown文本,现在可处理ppt,png等图像,但是硅基流动的deepseekOCR图像理解输出中文时的效果非常差,后续可能考虑直接用Qwen3-VL视觉模型辅助生成图像理解。 2.知识库代码的异步改造,为上传接口添加了失败回滚 3.文件上传可同步到minio。添加了rerank,threshold,top-K配置项。添加了知识库向量文档迁移功能,已经导入的向量在使用相同embedding模型的情况下可直接迁移向量不需要再录入 4.企业微信单点登录 5.user表添加字段permission,控制用户对智能体的访问权限,前端只显示可访问的智能体 make测试我不会啊,都是让ai帮我做了,基本就是写个python测试脚本用边界用例跑一下接口能过就行了。每天写需求就燃尽了 如果有哪些需要的部分我可以整理下可以推到主分支