lbl1120

Results 7 issues of lbl1120

是否考虑下一步,直接实现一个基于SQL数据库的问答模式? 可以直接连接mysql、oracle、sqlserver等大型数据库,然后根据事先定义好的查询语句,让LLM根据查询出来的结果去回答问题,这样既不用人工再去将数据库中的内容提取成问答,又便于程序直接查询,而且数据库中的内容,大部分都是结构化的,可能更有利于结果的准确

enhancement

为什么同样的脚本(Qwen1.5/examples/web_demo.py)去执行Qwen1.5-32B-Chat-GPTQ-Int4的推理时,4090 24G 比 V100 32G 回答速度快了5倍,这是什么原因,是显卡性能的问题,还是代码还有哪个配置没有打开,导致V100的计算能力没有发挥出来? ![Uploading 屏幕截图 2024-05-13 212724.png…]()

feature request

为什么同样的脚本(Qwen1.5/examples/web_demo.py)去执行Qwen1.5-32B-Chat-GPTQ-Int4的推理时,4090 24G 比 V100 32G 回答速度快了5倍,这是什么原因,是显卡性能的问题,还是代码还有哪个配置没有打开,导致V100的计算能力没有发挥出来? ![Uploading 屏幕截图 2024-05-13 212724.png…]()

为什么同样的脚本(Qwen1.5/examples/web_demo.py)去执行Qwen1.5-32B-Chat-GPTQ-Int4的推理时,4090 24G 比 V100 32G 回答速度快了5倍,这是什么原因,是显卡性能的问题,还是代码还有哪个配置没有打开,导致V100的计算能力没有发挥出来? ![Uploading 屏幕截图 2024-05-13 212724.png…]()

bug

### Self Checks - [X] I have searched for existing issues [search for existing issues](https://github.com/langgenius/dify/issues), including closed ones. - [X] I confirm that I am using English to submit this...

🌊 feat:workflow

Feel free to ask any kind of questions in the issues page, but please use English since other users may find your questions valuable. **Describe the bug** A clear and...

bug