Edisonwei54 comments

Results 16 comments of


                                            Edisonwei54

Bug] [ChatData] editor run sql error

> 是的，这将在以后修复，您可以从[这里](https://github.com/eosphoros-ai/DB-GPT-Web/issues/74)找到请问修复了吗？我使用最新版本，还是遇到了同样的问题

响应速度优化

> API更新 [4afecd1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4afecd1950845a974350cd2d8dc8dcf12398fba9) 我现在测试api的流式输出，感觉好像还是模型推理结束之后，把数据用流式的形式返回，而不是一边推理一边返回吧

响应速度优化

> 切割使用，分段流返但是在测试的时候，效果还是切割的片段全部推理结束之后才会流式分段返回，确实在播放的时候看到了时间上的自增

[Bug]: RuntimeError: No suitable kernel. h_in=16 h_out=3424 dtype=Float out_dtype=BFloat16

@WoosukKwon How can I solve this problem

[Bug]: RuntimeError: No suitable kernel. h_in=16 h_out=3424 dtype=Float out_dtype=BFloat16

> Current punica kernel can't process ` h_out=3424` , you can set `-tensor-parallel-size 2` to avoid this error Thanks, It can work now, but I still want to use all...

[Bug]: assert parts[0] == "base_model" AssertionError

Traceback (most recent call last): File "/opt/conda/envs/vllm/lib/python3.10/site-packages/vllm/lora/worker_manager.py", line 150, in _load_lora lora = self._lora_model_cls.from_local_checkpoint( File "/opt/conda/envs/vllm/lib/python3.10/site-packages/vllm/lora/models.py", line 246, in from_local_checkpoint return cls.from_lora_tensors( File "/opt/conda/envs/vllm/lib/python3.10/site-packages/vllm/lora/models.py", line 150, in from_lora_tensors module_name, is_lora_a...

Edisonwei54

Bug] [ChatData] editor run sql error

响应速度优化

响应速度优化

[Bug]: RuntimeError: No suitable kernel. h_in=16 h_out=3424 dtype=Float out_dtype=BFloat16

[Bug]: RuntimeError: No suitable kernel. h_in=16 h_out=3424 dtype=Float out_dtype=BFloat16

[Bug]: assert parts[0] == "base_model" AssertionError

[Bug]: assert parts[0] == "base_model" AssertionError

[Bug] 使用chat data 会话时，Editor状态下 sql 执行异常

[Bug] [ChatData] 使用Qwen-14B-Chat进行chatdata，报错

llama3-8b-instruct awq量化oom