Vinllen
Vinllen
抱歉,这几天有点忙,这个今天我晚点看下
改完报这个错那是连接问题了,你手动能连上吗?对于集群cluster是要每个db ip都能连接通才行的。这个报错捕获是不太合理,我后续会更新一下
报错的这台是10网段的,连不上吧?
报错的这台:10.14.16.122:10476呢。这个应该是某个db的地址,配的是172的网段,看这个应该走的10网段,看看机器ip是不是有啥特殊配置
你这个说的"承载网"是做的NAT转发?你看看集群cluster nodes显示本身应该也都是10网段的吧?这个驱动层面应该是有获取状态信息的,所以要改的话可能还得看下驱动层面的代码再修改,这个代价比较高了。 我建议,你可以把你A集群数据同步(可以用redis-shake)到A机房所在的1个standalone节点(假设为C),然后对外暴露172的网段,再对比B和C,相当于变相对于A和B了,这样可以绕开集群的driver。
嗯,你先对比看下,有问题再反馈。差异你是用info keyspace看出来的吧,正常应该是数据过期了但没被删除导致的。
不会同步,keyspace看到不一致是正常的,你用full-check校验一下好了
这个还是第一次见,应该哪里卡了,你要不重启一下吧,下个版本我加些堆栈信息。
你加下我微信吧,redis-shake的底部能找到我的微信方式,我发你个二进制打下堆栈信息再试一下,再有问题把堆栈信息打给我。
用户反馈:比较的线程数调到默认的5,就不会卡住,之前配置的32个线程。另外,还有qps、batchcount调到了1000,之前是5000。