Mason
Mason
你这边的部署我理解主要问题可能在以下两个方面: 1. runner 构建镜像时无法正常连接到容器镜像仓库,(bug导致,已做修复,存在概率registry存储桶创建失败) 2. 部署ksvc时拉取镜像失败,因为csghub registry是insecure的,当k3s尝试从这个镜像仓库拉取镜像时会有HTTPS信任问题,这个问题可以参考下quick_install.sh的脚本,这里面用的k3s实现的快速部署,看下里面配置的k3s的insecure registry的部分。我记得是生成了一个yaml文件,让k3s加载
1. 镜像可以直接替换成v1.12.1-ce 2. 如果是受信任的 registry,需要 `insecure: false` 3. 模型部署时,会拉取部署模型的框架的镜像,例如 llama.cpp 的镜像,这个需要访问外网
runner 服务
我看了下这个参数默认用的就是`ACR`的地址,是修改默认配置了吗?
我知道咋回事了,这个镜像不应该是检测 csghub docker 这边的。 因为咱们的环境属于 docker csghub + runner helm chart,所以控制下载镜像的镜像仓库参数在 runner chart 这边,所以应该设置如下参数: ```yaml --set modelRegistry="opencsg-registry.cn-beijing.cr.aliyuncs.com" ``` 所以你应该更新下 chart。 _提示:_ 上面的参数将在下一个 release 修改为如下: ```yaml --set model.registry="opencsg-registry.cn-beijing.cr.aliyuncs.com" ```
这里是个默认配置错误,目前已经 fix,可以临时修改下启动 omnibus-csghub 时: ```yaml server: download_endpoint: "" ```
@caizhenghao 因为 docker 版本才恢复更新不就,这里应该是测试遗漏了
默认未配置SMTP情况下,需要登录到casdoor中做修改,找到自己的用户,编辑修改密码,如果配置了SMTP,直接通过邮箱找回,SMTP需要在casdoor里面配置 email provider 然后关联给CSGHub Application
你是自定义了 temporal 的 entrypoint 是吗?替换掉了原有的 entrypoint.sh 的脚本?可以进入到 temporal 数据库看下`\dt`有什么内容吗?
temporal 的 entrypoint.sh 是否可以保持默认,看起来是 temporal 并没有做数据库初始化