Skip to main content

Обзор

  • Prometheus — сбор метрик по pull (HTTP), хранение временных рядов, язык запросов PromQL, алерты (Alertmanager).
  • Grafana — визуализация: дашборды по данным из Prometheus и других источников.

Ключевые темы

Метрики: имя + labels; типы: counter, gauge, histogram, summary. Пример: http_requests_total{method="GET", status="200"}.
Target’ы в конфиге; экспортеры (node_exporter, blackbox, для приложений — SDK или /metrics endpoint).
Базовые запросы: rate(), increase(), sum by (), ошибки и латентность (histogram_quantile).
Правила алертов в Prometheus; маршрутизация и группировка в Alertmanager; интеграции (Slack, PagerDuty).
Data source Prometheus; панели и запросы; переменные; алерты в Grafana (опционально).

Минимальный пример правила алерта

groups:
  - name: app
    rules:
      - alert: HighErrorRate
        expr: rate(http_requests_total{status=~"5.."}[5m]) > 0.1
        for: 5m
        labels: { severity: page }
        annotations:
          summary: "Высокий процент 5xx ошибок"

Что добавить сюда

  • Список экспортеров под свой стек
  • Готовые дашборды (ID из Grafana.com) и свои доработки
  • Ссылки на документацию Prometheus и Grafana