prometheus_grafana_loki_-_observability
Prometheus, Grafana, Loki - Observability
Реклама
Мониторинг не нужен, если он формален и не нацелен на бизнес-результат
Observability — переход от простого сбора метрик к пониманию влияния ИТ-решений на бизнес-показатели, прогнозированию сбоев и автоматизации реагирования
Бизнес-метрики - мониторинг не сервисов, а действий пользователя (например, количество успешных подключений)
Умные оповещения - должны приходить только при реальной угрозе для сервиса а не по каждому незначительному отклонению
Автоматизация - запуск процедур восстановления параллельно с уведомлениями инженеров
Техническое задание
Настроить учет работы систем, сервисов и сетей предприятия с точки зрения: метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA)
После окончания обучения слушатель будет знать
Фундаментальные понятия мониторинга
Показатели качества (SLI/SLO/SLA)
Технические термины мониторинга
Основные этапы мониторинга
После окончания обучения слушатель будет уметь
Разворачивать стек продуктов Prometheus, Grafana, Loki
Настраивать сбор метрик в Prometheus с использование exporter
Автоматизировать поиск и добавлять собственные источники метрик
Использровать язык запросов PromQL для анализа и визуализации измерений
Настраивать сбор, фильтрацию и анализ журналов с использованием Loki и языка LogQL
Использовать готовые и создавать собственные dashboard в Grafana
Настраивать уведомления в Prometheus Alertmanager с использованием готовых и собственных правил
Настраивать маршрутизацию уведомлений с использованием Email и Webhook
Настраивать уведомления в Grafana
Модуль 1. Основы наблюдаемости и архитектура стека
Теория
SLA (Service Level Agreement) и SLO (Service Level Objective)
Метрики, Логи, Трейсы, Чем отличается мониторинг от наблюдаемости
Роль каждого компонента (Prometheus, Grafana, Loki) в экосистеме
Практика
Модуль 2. Сбор и анализ метрик с Prometheus
Модуль 3. Централизация логов с Loki
Установка Loki
Установка и настройка Promtail для доставки логов приложений и системных журналов
Язык LogQL, фильтрация и анализ логов (поиск ошибок, парсинг JSON, агрегация статистики по логам)
Модуль 4. Визуализация данных и дашборды в Grafana
-
-
-
Создание dashboard “Мониторинг сервиса” с метриками приложения, статусами сервисов от которых оно зависит и виджетами последних ошибок из логов
Типы панелей (Time series, Table, Stat, Logs), настройка внешнего вида и переменных, интерактивные дашборды
Модуль 5. Алертинг и обнаружение проблем
Идеи для курса
Черновик
prometheus_grafana_loki_-_observability.txt · Last modified: 2026/05/27 09:24 by val