异常流量趋势检测
我们不一样!告诉你百度是如何做智能流量异常检测的:https://mp.weixin.qq.com/s?__biz=MzUyMzA3MTY1NA%3D%3D&chksm=f9c37dfeceb4f4e8036c176c6f10af897ce9aeb8ce2691085bc889578601309e99fe235209b6&idx=1&mid=2247484471&scene=21&sn=1ca274dd203f6b7e85d7012575aaa445#wechat_redirect
两阶段:预测+检测
预测阶段:
移动平均算法存在落后于趋势的误报漏报,用普通的最小二乘法(凸函数)对离群点过于敏感,因此使用IRLS方法进行鲁棒回归。这个方法很有意思,可以非凸优化,但我没找到比较完整的分析证明文章,比较遗憾。
检测阶段:
泊松分布假设,如果低于期望值,计算P{流量<=当前流量},低于某个阈值说明是突降,如果高于期望值,计算P{流量>=当前流量},低于某个阈值说明是突升。因为泊松分布,不好计算概率,如果lambda >= 20,可以直接用正态分布近似。
框架还不错,还有两个超参需要确定:时间窗口大小,以及概率阈值(阈值似乎用得是0.5%)。没有可靠的数据,不好确定。如果平台支持做标注和配置,就可以进行超参的设定和迭代。
最后指出了局限性和可能的改进:

另外一篇《百度大规模时序指标自动异常检测实战》:https://max.book118.com/html/2019/0712/6240131200002044.shtm, 对不同种类的指标变化,用决策树进行自动配置:

还没人赞这篇日记