Happy

Results 12 comments of Happy

> 通过查阅相关模块文档,没有看到主从延迟比较大,比如延迟几分钟这样,如果主库发生故障,那么是否切换,如何控制高延迟的是否切换,是否会自动修复数据差异后切换? 这个问题其实需要业务自己决定,作为一个工具无法提供切or不切。 针对这个问题,可以细化几种场景 > 看业务级别: - 如果认为丢点数据没有问题,就可以切换。**业务会丢一部分数据** - 否则请看下面的逻辑 > 主库binlog是否完全同步给从库relay-log - 全部同步,只延迟几分钟,我理解可以切换,切换后依然开启只读,等relay-log全部回放完再关闭只读。**影响业务只读时间长一点,数据不丢不花** - 全部同步,延迟大于几小时,**需要业务方接入,决定切or不切** @jdj199222

I think maybe the http body is too big and the client timeout is too short. So should we record all events in containerRecords?

The solution for successful deletion was found. Update `timeoutSeconds` in kind `MutatingWebhookConfiguration`. ![image](https://github.com/chaos-mesh/chaos-mesh/assets/20750625/a726a7c8-8238-4704-b0a3-24c7e1940d08)

mac 上未复现 ![image](https://github.com/OpenAtomFoundation/pika/assets/20750625/d39cee54-f144-453a-bc0f-7aeeb8fb532e) @chejinge

关于快慢命令的几个问题和方案需要确定下: # 方案: 1、计划添加`是否开启自动发现慢命令`参数,默认开启,也支持关闭。最终实现三种模式的慢命令设置:纯自动配置(程序自动哦发现)、纯手动配置(现在的方式)、手动配置 + 自动配置。这样是否可以? 2、关于慢命令执行时间设置:添加`慢命令执行时间阈值`参数,默认1s,是否可行?未来这个值可基于当前负载动态计算出来 3、慢命令如何更优判定 如果一个cmd的请求超出这个时间阈值,就立刻判断为慢命令吗?还是做一些平滑计算?同理如何从慢命令集合摘除?目前想到的一些策略如下: - 一次执行时间 `大于/小于` 阈值就 `添加/摘除` ? - 连续N次执行时间 `大于/小于` 阈值就 `添加/摘除`? - 滑动窗口内N次执行时间 `大于/小于` 阈值就 `添加/摘除`? - 滑动窗口内平均执行时间 `大于/小于` 阈值就 `添加/摘除`?...

关于动态调整线程数的一些问题和方案: # 方案 1、线程数动态调整策略:判断线程池中queue的task个数,如果挤压超过某个阈值就添加新的thread,如果长时间空闲就回收thread。添加可以一次多个,回收逐次-1 2、快慢命令使用统一线程池:仿照rocksdb,支持Priority::HIGH、Priority::LOW