prometheus scraper doesn't aggregate
最近踩两个同样的低级坑。
一个是埋点时候多打了个 label,直觉上觉得没事,我配置采集的时候把这个多余的 label 给 drop 掉不就行了,先不着急改埋点的地方吧。
一个是弄了个 pushgateway,用来集中统计个 counter 的指标。
都跪在 prometheus 没事不会对指标做任何聚合这一点上,两个指标源、同一个指标的名字+label的指标,里面的值不同,会导致的指标的内容完全随机掉,尤其是 counter,出来的数完全飘了。
在拉模型下,prometheus 在拉指标时一定会给指标附加一个 job 和 instance 的 label,这样能使每个实例的 metric 名字唯一。但是 pushgateway 这货就不管这个了,需要自己注意在 label 中不要有重名的情况出现,不然指标值会相互覆盖,在 counter 的计算规则下会使实际的数值变大很多很多。
简单说就是使用 pushgateway 的话仍需要区分一把每个进程实例的唯一标示,一定要打进 label 中。
prom-aggregation-gateway 可能稍微好一点,能自动聚合同名指标的 counter 和 histogram。
红色有角F叔的最新日记 · · · · · · ( 全部 )
- random 2025-01-04 (3人喜欢)
- random 2024-12-08 (3人喜欢)
热门话题 · · · · · · ( 去话题广场 )
-
加载中...