This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
prometheus_grafana_loki_-_observability [2026/05/14 13:07] val [Модуль 2. Сбор и анализ метрик с Prometheus] |
prometheus_grafana_loki_-_observability [2026/05/27 09:24] (current) val [Модуль 2. Сбор и анализ метрик с Prometheus] |
||
|---|---|---|---|
| Line 13: | Line 13: | ||
| * Настроить учет работы систем, сервисов и сетей предприятия с точки зрения: метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA) | * Настроить учет работы систем, сервисов и сетей предприятия с точки зрения: метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA) | ||
| + | |||
| + | ===== После окончания обучения слушатель будет знать ===== | ||
| + | |||
| + | * Фундаментальные понятия мониторинга | ||
| + | * Показатели качества (SLI/SLO/SLA) | ||
| + | * Технические термины мониторинга | ||
| + | * Основные этапы мониторинга | ||
| + | |||
| + | ===== После окончания обучения слушатель будет уметь ===== | ||
| + | |||
| + | * Разворачивать стек продуктов Prometheus, Grafana, Loki | ||
| + | * Настраивать сбор метрик в Prometheus с использование exporter | ||
| + | * Автоматизировать поиск и добавлять собственные источники метрик | ||
| + | * Использровать язык запросов PromQL для анализа и визуализации измерений | ||
| + | * Настраивать сбор, фильтрацию и анализ журналов с использованием Loki и языка LogQL | ||
| + | * Использовать готовые и создавать собственные dashboard в Grafana | ||
| + | * Настраивать уведомления в Prometheus Alertmanager с использованием готовых и собственных правил | ||
| + | * Настраивать маршрутизацию уведомлений с использованием Email и Webhook | ||
| + | * Настраивать уведомления в Grafana | ||
| ===== Модуль 1. Основы наблюдаемости и архитектура стека ===== | ===== Модуль 1. Основы наблюдаемости и архитектура стека ===== | ||
| Line 23: | Line 42: | ||
| * Метрики, Логи, Трейсы, Чем отличается мониторинг от наблюдаемости | * Метрики, Логи, Трейсы, Чем отличается мониторинг от наблюдаемости | ||
| * Роль каждого компонента (Prometheus, Grafana, Loki) в экосистеме | * Роль каждого компонента (Prometheus, Grafana, Loki) в экосистеме | ||
| + | |||
| + | ==== Практика ==== | ||
| + | |||
| + | * Развертывание стенда предприятия | ||
| Line 28: | Line 51: | ||
| * Установка [[Сервис Prometheus]] | * Установка [[Сервис Prometheus]] | ||
| - | * Настройка экспортера ([[Сервис Prometheus#prometheus-node-exporter]] для метрик ОС), принцип pull-модели | + | * Использование экспортеров, принцип pull-модели |
| + | * Пример [[Сервис Prometheus#prometheus-node-exporter]] для сбора метрик ОС, оценка загрузки CPU, RAM, сети, задержки ввода/вывода | ||
| * Язык [[Сервис Prometheus#Запросы PromQL]]: Изучение типов данных (счетчики, измеряемые величины, гистограммы), операторов и агрегаций | * Язык [[Сервис Prometheus#Запросы PromQL]]: Изучение типов данных (счетчики, измеряемые величины, гистограммы), операторов и агрегаций | ||
| - | * Оценка загрузки CPU, RAM, сети, задержки ввода/вывода | + | * Пример [[Сервис Prometheus#prometheus-apache-exporter]] для сбора метрик "штатного" приложения, [[Сервис HTTP#Нагрузочное тестирование]] |
| - | * [[Сервис Prometheus#prometheus-apache-exporter]] | + | |
| * Service Discovery | * Service Discovery | ||
| - | * Настройка экспортера ([[Сервис Prometheus#prometheus-pushgateway]] и [[Сервис Prometheus#Пример сбора метрик из приложения]], которое работает периодически, использование push-модели | + | * Использование push-модели [[Сервис Prometheus#prometheus-pushgateway]] и [[Сервис Prometheus#Отправка метрик из приложения]] |
| + | * prometheus federation | ||
| ===== Модуль 3. Централизация логов с Loki ===== | ===== Модуль 3. Централизация логов с Loki ===== | ||
| Line 45: | Line 69: | ||
| * Установка [[Сервис Grafana]] | * Установка [[Сервис Grafana]] | ||
| * [[Сервис Grafana#Подключение Prometheus]] и Loki к Grafana. | * [[Сервис Grafana#Подключение Prometheus]] и Loki к Grafana. | ||
| - | * Создание [[Сервис Grafana#Grafana dashboard]], типы панелей (Time series, Table, Stat, Logs), настройка внешнего вида и переменных, интерактивные дашборды | + | * [[Сервис Grafana#Импорт готовых dashboard]] в Grafana |
| - | * Пример дашборда "Мониторинг сервиса" с метриками приложения, статусами сервисов от которыых оно зависит и виджетами последних ошибок из логов | + | * [[Сервис Grafana#Создание dashboard]] "Мониторинг сервиса" с метриками приложения, статусами сервисов от которых оно зависит и виджетами последних ошибок из логов |
| + | * Типы панелей (Time series, Table, Stat, Logs), настройка внешнего вида и переменных, интерактивные дашборды | ||
| ===== Модуль 5. Алертинг и обнаружение проблем ===== | ===== Модуль 5. Алертинг и обнаружение проблем ===== | ||
| - | * [[Сервис Prometheus#prometheus-alertmanager]] | + | * Установка [[Сервис Prometheus#prometheus-alertmanager]] |
| - | * [[Сервис Prometheus#Настройка маршрутизации уведомлений]] (Email, Webhook) | + | * [[Сервис Prometheus#Настройка маршрутизации уведомлений]] (Email, Webhook) и [[Сервис Prometheus#Тестирование alertmanager]] |
| - | * [[Сервис Prometheus#Создание правил alertmanager]] (например, "сервис не отвечает", "много 500-х ошибок") | + | * [[Сервис Prometheus#Подключение готовых правил alertmanager]] |
| + | * [[Сервис Prometheus#Подключение Alertmanager к Prometheus]] | ||
| + | * [[Сервис Prometheus#Создание правил alertmanager]] | ||
| * Управление инцидентами, настройка silence (подавление алертов), агрегация нотификаций | * Управление инцидентами, настройка silence (подавление алертов), агрегация нотификаций | ||
| - | * Grafana Alerting, настройка алертов непосредственно в интерфейсе Grafana | + | * [[Сервис Grafana#Настройка уведомлений]] непосредственно в интерфейсе Grafana (вместе с оценкой пороговых значений, на примере [[Сервис Prometheus#Отправка метрик из приложения]]) |
| ===== Идеи для курса ===== | ===== Идеи для курса ===== | ||