部署MVP后登录tee节点不可用
本机信息:ubuntu 22.04,8VCPU|32GB内存|1.7T本地盘 部署步骤: 解压后,本地ifconfig没有eth0,对install.sh做了以下几处更改: 对查询eth0信息的改为ens5: 149行新增: sed -i '201s/eth0/ens5/' $(pwd)/start_standalone.sh 222行新增: sed -i '279s/eth0/ens5/' $(pwd)/deploy.sh 231行修改: ipv4=$(ip -4 addr show ens5 | grep -oP '(?<=inet\s)\d+(.\d+){3}') || true
运行bash install.sh
报错:[Error] Probe datamesh in container 'zchain-kuscia-lite-tee' failed.
hello,mvp版本的是什么版本? 把docker logs zchain-kuscia-lite-tee日志详情发一下。
MVP版本不知道在哪里看,上周下载的包 secretflow-allinone-package-latest.tar.gz
镜像信息:
tee日志:
你好 在比较新的ubuntu中查询ip的方式为:ip addr show 您可能会看到以"en"开头的名称,如"enp0s1"或者"ens33",这些是新的网络接口名称,麻烦试一下这个ip。
麻烦打印一下kuscia里这两个日志:/home/kuscia/var/logs/k3s.log、/home/kuscia/var/logs/kuscia.log
@hlysf
你好可以看下 install.sh 脚本里获取master地址是不是正确的
kuscia.log
你好,ip是正确的
麻烦打印一下kuscia里这两个日志:/home/kuscia/var/logs/k3s.log、/home/kuscia/var/logs/kuscia.log
k3s.log:
kuscia.log
麻烦执行一下以下命令,并把相对应的 stdout 输出
- 获取tee容器配置:docker exec -it [tee 容器id] cat etc/kuscia.yaml
- 获取主机ip: ifconfig $(ip route | grep default | cut -d" " -f5)
麻烦执行一下以下命令,并把相对应的 stdout 输出
- 获取tee容器配置:docker exec -it [tee 容器id] cat etc/kuscia.yaml
- 获取主机ip: ifconfig $(ip route | grep default | cut -d" " -f5)
1、tee容器配置
2、主机ip
从贴出的 tee 启动配置中 master 地址是 https://192.169.1.3:8080, 启动的网卡是ens5,ip地址是 10.299.208.32 不一致。需要按照以下方式确认:
- 看看修改的脚本网卡是否使用的 ens5
- 本地执行 https://10.299.208.32:18080 是否返回 401 http code
- 本地是否切换过网络。如果是建议重装,tee节点安装脚本,后期我们将优化
docker logs -f [tee 容器] 看下呢,目前从日志看都是okay的。除了日志,部署有报错吗。如果没有可以在页面上尝试下发tee任务
- docker ps
- 在主机上执行 https://10.299.208.32:18080 是否返回 401 http code
- docker ps
- 在主机上执行 https://10.299.208.32:18080 是否返回 401 http code
1、docker ps
2、请问有执行命令吗?
主机上访问master地址 curl -kv https://10.299.208.32:18080 是否返回 401 http code
curl -kv https://10.299.208.32:18080
是的。
可以按照以下方式排查:
- 查看master kuscia.log tee相关日志:docker exec -it ${USER}-kuscia-master cat var/logs/kuscia.log | grep tee
- 查看master 节点的路由日志: docker exec -it ${USER}-kuscia-master cat var/logs/envoy/external.log | grep tee
2. docker exec -it ${USER}-kuscia-master cat var/logs/envoy/external.log | grep tee
1、master kuscia.log tee相关日志:
2、master 节点的路由日志筛选没有结果
- 进入tee节点查看配置: docker exec -it ${USER}-lite-tee cat etc/kuscia.yaml
- 进入tee节点访问master地址:docker exec -it ${USER}-lite-tee curl -kv https://10.299.208.32:18080
看起来是使用的网卡不对,试试其他active的网址地址呢,按照上面的排查方式
2、主机ip 

2、请问有执行命令吗?