This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
prometheus_grafana_loki_-_observability [2026/05/14 16:02] val [Модуль 5. Алертинг и обнаружение проблем] |
prometheus_grafana_loki_-_observability [2026/05/27 09:24] (current) val [Модуль 2. Сбор и анализ метрик с Prometheus] |
||
|---|---|---|---|
| Line 13: | Line 13: | ||
| * Настроить учет работы систем, сервисов и сетей предприятия с точки зрения: метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA) | * Настроить учет работы систем, сервисов и сетей предприятия с точки зрения: метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA) | ||
| + | |||
| + | ===== После окончания обучения слушатель будет знать ===== | ||
| + | |||
| + | * Фундаментальные понятия мониторинга | ||
| + | * Показатели качества (SLI/SLO/SLA) | ||
| + | * Технические термины мониторинга | ||
| + | * Основные этапы мониторинга | ||
| + | |||
| + | ===== После окончания обучения слушатель будет уметь ===== | ||
| + | |||
| + | * Разворачивать стек продуктов Prometheus, Grafana, Loki | ||
| + | * Настраивать сбор метрик в Prometheus с использование exporter | ||
| + | * Автоматизировать поиск и добавлять собственные источники метрик | ||
| + | * Использровать язык запросов PromQL для анализа и визуализации измерений | ||
| + | * Настраивать сбор, фильтрацию и анализ журналов с использованием Loki и языка LogQL | ||
| + | * Использовать готовые и создавать собственные dashboard в Grafana | ||
| + | * Настраивать уведомления в Prometheus Alertmanager с использованием готовых и собственных правил | ||
| + | * Настраивать маршрутизацию уведомлений с использованием Email и Webhook | ||
| + | * Настраивать уведомления в Grafana | ||
| ===== Модуль 1. Основы наблюдаемости и архитектура стека ===== | ===== Модуль 1. Основы наблюдаемости и архитектура стека ===== | ||
| Line 23: | Line 42: | ||
| * Метрики, Логи, Трейсы, Чем отличается мониторинг от наблюдаемости | * Метрики, Логи, Трейсы, Чем отличается мониторинг от наблюдаемости | ||
| * Роль каждого компонента (Prometheus, Grafana, Loki) в экосистеме | * Роль каждого компонента (Prometheus, Grafana, Loki) в экосистеме | ||
| + | |||
| + | ==== Практика ==== | ||
| + | |||
| + | * Развертывание стенда предприятия | ||
| Line 34: | Line 57: | ||
| * Service Discovery | * Service Discovery | ||
| * Использование push-модели [[Сервис Prometheus#prometheus-pushgateway]] и [[Сервис Prometheus#Отправка метрик из приложения]] | * Использование push-модели [[Сервис Prometheus#prometheus-pushgateway]] и [[Сервис Prometheus#Отправка метрик из приложения]] | ||
| + | * prometheus federation | ||
| ===== Модуль 3. Централизация логов с Loki ===== | ===== Модуль 3. Централизация логов с Loki ===== | ||
| Line 55: | Line 79: | ||
| * [[Сервис Prometheus#Подключение готовых правил alertmanager]] | * [[Сервис Prometheus#Подключение готовых правил alertmanager]] | ||
| * [[Сервис Prometheus#Подключение Alertmanager к Prometheus]] | * [[Сервис Prometheus#Подключение Alertmanager к Prometheus]] | ||
| - | * [[Сервис Prometheus#Создание правил alertmanager]] (например, "сервис не отвечает", "много 500-х ошибок") | + | * [[Сервис Prometheus#Создание правил alertmanager]] |
| * Управление инцидентами, настройка silence (подавление алертов), агрегация нотификаций | * Управление инцидентами, настройка silence (подавление алертов), агрегация нотификаций | ||
| - | * [[Сервис Grafana#Настройка уведомлений]] непосредственно в интерфейсе Grafana для оценки пороговых значений на примере [[Сервис Prometheus#Отправка метрик из приложения]] | + | * [[Сервис Grafana#Настройка уведомлений]] непосредственно в интерфейсе Grafana (вместе с оценкой пороговых значений, на примере [[Сервис Prometheus#Отправка метрик из приложения]]) |
| ===== Идеи для курса ===== | ===== Идеи для курса ===== | ||