xuji755

Results 28 issues of xuji755

### Description 如果某个租户内的OBSERVER的数据严重不均衡,会引发哪些OB的问题(性能,风险),如何去做诊断分析才能比较准确的查出根因?如果发现问题,如何去优化处理?

question

SQL执行RETRY次数突然增加,可能是哪些原因导致,如何排查定位原因

question

### Description OceanBase不同OBSERVER的数据库服务器的CPU使用率不均衡,有的服务器CPU已经出现瓶颈,有些服务器CPU使用率还比较空闲,可能引起什么问题,该如何排查分析 --

question

### Describe your use case DUMP出OBSERVER列表及其关键指标 ### Describe the solution you'd like DUMP出OBSERVER LIST及相关信息 ### Describe alternatives you've considered 信息清单如下: 1、基本信息 所在服务器IP/PORT 所属ZONE 分配的 CPU/内存/文件系统容量等基本信息 2、状态信息: 创建时间 启动时间 状态 所在服务器的CPU使用率...

enhancement

### Describe your use case 不同的OBSERVER允许设置不同的参数,对于分布式数据库而言,检查参数设置是否合理十分关键。检查某个租户涉及的OBSERVER上面参数配置存在差异的地方 ### Describe the solution you'd like 功能1-参数全面扫描 1、列出非默认参数列表 2、标识该参数是否在所有OBSERVER上配置都相同,如果存在不同,列出SERVER的,及参数配置 3、分析是否在某个OBSERVER上的参数设置不合理 功能2-某个参数的分析(功能类似功能1) 功能3-关键参数检查(类似功能1,不过需要有内置的关键参数清单) ### Describe alternatives you've considered _No response_ ### Additional context _No response_

enhancement

### Describe your use case 对某个指定时间段内的OBSERVER日志进行深度分析 ### Describe the solution you'd like 1)某个时间区间内日志报错总体分析 1、根据错误和INFO的种类进行归并,给出各类INFO\WARN\ERROR的汇总分析(某类告警信息的数量) 2、对每个ERROR进行深度分析:问题的可能原因,问题集中的时间段(可以按照10分钟划分时段,统计数量),可能的建议(如果有) 3、给出这个时间段内系统风险等级评价,并对发现进行总结 2)某个错误条目的详细解释 输入某个错误文本,自动解析错误信息,并给出分析诊断结果 1、错误汇总的每个关键内容的解析 2、错误可能发生的原因 3、风险评价 4、建议 ### Describe alternatives you've considered _No response_ ###...

### Description 某租户会话连接缓慢可能的根因有哪些? 1、网络问题(丢包、防火墙等因素) 2、proxy性能问题(负载过高,会话连接数量过多等) 3、租户负载过高,响应缓慢 4、租户当时的并发连接过高 5、租户总体性能不佳 还有哪些原因呢? 下列影响因素是否会引发这个问题,或者影响会话连接速度? 1、正在做备份 2、服务器IO延时过高 3、正在做数据合并

RCA

### Describe your use case 当系统中存在RootService自动触发的切主行为时,有些可能是正常行为,有些可能是异常行为。如果频繁出现,引发了系统问题。则需要对根因进行分析。 ### Describe the solution you'd like 1、如何主动发现此类行为存在,如何发现其中的高危行为? 2、如何快速定位根因? ![rootservice](https://github.com/oceanbase/obdiag/assets/55684438/2766d3f9-493a-434e-b021-2c05bd563772) ### Describe alternatives you've considered _No response_ ### Additional context _No response_

RCA