Sentinel
Sentinel copied to clipboard
会在某一个1s突然出现过多失败次数,造成错误熔断
Issue Description
Type: 利用dubbo rpc框架,采用的随机权重负载均衡策略,其中某个下游服务器有8个节点,突然有个节点频繁old gc出现响应超时。consumer单台机器 qps 13左右,设置的降级规则,为失败率50%进行熔断,按说1/8的节点,不会到达50的失败率。但是看sentinel metric日志,会在某一个1s窗口突然出现10次左右失败统计,造成失败率超过50%进行熔断,所以反而把服务质量变得更差了,求解

Dubbo随机权重策略在节点响应时间突增时可能会形成隐形权重倾斜。超时节点因响应阻塞导致处理能力骤降,但权重未动态调整,导致后续请求仍以原权重概率分配,造成瞬时堆积。此时若请求集中分配到问题节点,故障率可能远大于直觉上的1/8