rtp-llm
rtp-llm copied to clipboard
support ebedding和reranker 部署时量化8
w8a8还是weight only,weight only暂时还没支持
weight only
也就是现在我外部量化8后ebedding是支持量化部署的?
等我们下次更新补充这部分文档说明 直接转的ckpt格式可能会有点问题