jixinpu
jixinpu
因为我这个数据集可能不太好,导致它们之间的差别不是很大,所以分析出来结果不一样。
在设置dtw阈值的时候,我们使用了人工的方法,看看哪种阈值的情况下,序列为周期序列。确实先归一化再去求dtw距离,这样误差会更好控制一些。 时间序列周期性最终归结为求序列相关性的问题,可以有很多方法去解决:皮尔逊相关系数、dtw都可以。 我们在实践中为了减少误报,使用了多种方法投票的方式来检测周期性问题。
我们使用的方法因为是人为去跟踪了一些时间序列,所以准确率还是很高的。但是不论使用哪种方法,我们都需要根据一些case自己去设置阈值。看了很多论文,好像都需要去设置阈值。因为周期性检测归根结底就是求距离,避免不了去设置阈值。
因为我们业务数据是以天为一周期,一小时一个点,所以设置的是24
您所指的stl相关是什么?
我在进行周期性提取之前,首先判断它是否具有周期性,使用的是分段dtw方法,具体可以看代码aiopstools/examples/ts_period_predict.py。
有两个概念:一个是报警事件,这种在例子里面就是六大类报警项(host.alive等),还有一种是监控项,要分析哪些监控项和报警项有关。