longSky comments

Results 9 comments of


                                            longSky

The docker image is synchronized with the latest official features

You may not understand what I mean exactly. What I mean is that the interface and operation of the official web version and client version are different from the interface...

官方docker无法使用

> ![image](https://private-user-images.githubusercontent.com/47915665/309164580-bbb0be4e-980d-434e-b6e7-b7a4c18d599a.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MTEyODMyMjAsIm5iZiI6MTcxMTI4MjkyMCwicGF0aCI6Ii80NzkxNTY2NS8zMDkxNjQ1ODAtYmJiMGJlNGUtOTgwZC00MzRlLWI2ZTctYjdhNGMxOGQ1OTlhLnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDAzMjQlMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQwMzI0VDEyMjIwMFomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPWUzOGExZDc3MmQyNjBhYTRiMmIwYzk1MjZjMWU3ZmJkZDA5YTkyZmNkZWFmZWFiNWViZmQwYjg5Zjk4MjFhODMmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.FgIbxiPIXEzBukTu5kElVrAmNJ_9E6i-7PmuYYSyzlw) 出现错误： ./build/bin/main: error while loading shared libraries: libggml.so: cannot open shared object file: No such file or directory 这个需要pip install .，有的是直接pip install chatglm_cpp，都可以的，这个其实和cpp还是有关系的，这个主要就是实现C++加速推理嘛

如何保存会话，比如，我之前，已经告诉他，让他记住一个电话号码，以后重新启动这个程序，能让他告诉我这个电话号码吗？

那需要你二次开发了，比如存到向量数据库的

streamlit run chatglm3_demo.py 执行后报错，No module named 'chatglm_cpp._C' ，是什么原因呢？

pip install .，也可以

streamlit run chatglm3_demo.py 执行后报错，No module named 'chatglm_cpp._C' ，是什么原因呢？

是通过openai_api.py来做APIServer报错的吧？那么可以尝试给chatglm_cpp改名或者在chatglm_cpp下执行命令，都是可以解决问题的。问题应该是chatglm_cpp.openai_api有冲突，一个之前pip install的时候已经有chatglm_cpp，而当前文件夹又是chatglm_cpp，下面的__init__.py就引用了chatglm_cpp._C

-DGGML_CUBLAS=ON，编译成功之后无法使用显卡进行推理，仍然使用CPU进行推理

> 补充一下，因为直接pip安装chatglm_cpp会报错，我使用的是（[https://github.com/li-plus/chatglm.cpp/releases/tag/v0.3.0）下载的chatglm_cpp-0.3.0-cp310-cp310-win_amd64.whl进行安装的，安装指令为下载好的文件存储路径下](https://github.com/li-plus/chatglm.cpp/releases/tag/v0.3.0%EF%BC%89%E4%B8%8B%E8%BD%BD%E7%9A%84chatglm_cpp-0.3.0-cp310-cp310-win_amd64.whl%E8%BF%9B%E8%A1%8C%E5%AE%89%E8%A3%85%E7%9A%84%EF%BC%8C%E5%AE%89%E8%A3%85%E6%8C%87%E4%BB%A4%E4%B8%BA%E4%B8%8B%E8%BD%BD%E5%A5%BD%E7%9A%84%E6%96%87%E4%BB%B6%E5%AD%98%E5%82%A8%E8%B7%AF%E5%BE%84%E4%B8%8B) $env:CMAKE_ARGS="-DGGML_CUBLAS=ON"; pip install chatglm_cpp-0.3.0-cp310-cp310-win_amd64.whl。是不是跟这个有关系呢？小白求指点我知道问题所在了！虽然一开始cmake已经使用-DGGML_CUBLAS=ON，但是你也说了运行web_demo的时候还会报错。这个时候，其实还需要你自己解决这个问题，这个时候你可以pip install .（我看也有写pip install chatglm_cpp的都行），这个时候再运行web_demo就不报错了。这个时候呢，你会发现运行起来推理还是用CPU！我也是后来才发现，其实pip install .的时候也进行了cpp的编译，然后我就这么pip install：CMAKE_ARGS="-DGGML_CUBLAS=ON" pip install .，就是啊，这个时候也需要-DGGML_CUBLAS=ON。再次运行web_demo，推理就是用GPU了！！你试试，我自己是搞成了。

运行chatglm3-6b-ggml int4量化模型，采用clblast加速反而比cpu加速慢很多，正常吗？

> 机器配置i7-12700F，3060显卡12GB显存，64GB 内存。可以先观察下推理的时候到底用的CPU还是GPU

Q4_0 + CPU转换避坑指南

> 请问下你们有试过GPU版本的么，我试了怎么编译都是用CPU推理我也存在这个问题，虽然有GPU，但是一直用CPU推理