aiopstools
aiopstools copied to clipboard
关于alarm_association模块的数据疑问
例子里的数据集没看懂,host.alive 存活监控都是时间序列数据,是指这段时间主机宕机了吗,例子中的数据集能否解释下,host.alive最终和cpu.idle有关和网卡流量无关,从数据里面,我没看出来有什么关系
有两个概念:一个是报警事件,这种在例子里面就是六大类报警项(host.alive等),还有一种是监控项,要分析哪些监控项和报警项有关。
有两个概念:一个是报警事件,这种在例子里面就是六大类报警项(host.alive等),还有一种是监控项,要分析哪些监控项和报警项有关。
报警关联分析数据生产上能否给个具体实际的场景,我觉得通过报警项分析出关联的监控项好像意义不是很大,因为主机存活,磁盘空间不足,这些报警项找相关的监控项有实际的意义吗,能否介绍下生产下实际的场景
谢谢作者提供的源码,目前有两个问题想请教一下。 问题一:alarm_data_filename里的格式到底是什么样的?我目前的猜测是,每一列是一个报警采样,共5列,即5个警报的时间序列数据,是这样理解的吗? 问题二: alarm_association.py里的18行,timegap = int((alarmtime[-1]-alarmtime[0]) / 600),这算的时间间隔指的是什么时间间隔呢?/600是怎么来的呢?