User Tools

Site Tools


prometheus_grafana_loki_-_observability

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
prometheus_grafana_loki_-_observability [2026/05/14 14:06]
val [Модуль 4. Визуализация данных и дашборды в Grafana]
prometheus_grafana_loki_-_observability [2026/05/27 09:24] (current)
val [Модуль 2. Сбор и анализ метрик с Prometheus]
Line 13: Line 13:
  
   * Настроить учет работы систем,​ сервисов и сетей предприятия с точки зрения:​ метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA)   * Настроить учет работы систем,​ сервисов и сетей предприятия с точки зрения:​ метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA)
 +
 +===== После окончания обучения слушатель будет знать =====
 +
 +  * Фундаментальные понятия мониторинга ​
 +  * Показатели качества (SLI/​SLO/​SLA)
 +  * Технические термины мониторинга
 +  * Основные этапы мониторинга
 +
 +===== После окончания обучения слушатель будет уметь =====
 +
 +  * Разворачивать стек продуктов Prometheus, Grafana, Loki
 +  * Настраивать сбор метрик в Prometheus с использование exporter
 +  * Автоматизировать поиск и добавлять собственные источники метрик
 +  * Использровать язык запросов PromQL для анализа и визуализации измерений
 +  * Настраивать сбор, фильтрацию и анализ журналов с использованием Loki и языка LogQL
 +  * Использовать готовые и создавать собственные dashboard в Grafana
 +  * Настраивать уведомления в Prometheus Alertmanager с использованием готовых и собственных правил
 +  * Настраивать маршрутизацию уведомлений с использованием Email и Webhook
 +  * Настраивать уведомления в Grafana
  
 ===== Модуль 1. Основы наблюдаемости и архитектура стека ===== ===== Модуль 1. Основы наблюдаемости и архитектура стека =====
Line 23: Line 42:
   * Метрики,​ Логи, Трейсы,​ Чем отличается мониторинг от наблюдаемости   * Метрики,​ Логи, Трейсы,​ Чем отличается мониторинг от наблюдаемости
   * Роль каждого компонента (Prometheus,​ Grafana, Loki) в экосистеме   * Роль каждого компонента (Prometheus,​ Grafana, Loki) в экосистеме
 +
 +==== Практика ====
 +
 +  * Развертывание стенда предприятия
  
  
Line 31: Line 54:
   * Пример [[Сервис Prometheus#​prometheus-node-exporter]] для сбора метрик ОС, оценка загрузки CPU, RAM, сети, задержки ввода/​вывода   * Пример [[Сервис Prometheus#​prometheus-node-exporter]] для сбора метрик ОС, оценка загрузки CPU, RAM, сети, задержки ввода/​вывода
   * Язык [[Сервис Prometheus#​Запросы PromQL]]: Изучение типов данных (счетчики,​ измеряемые величины,​ гистограммы),​ операторов и агрегаций   * Язык [[Сервис Prometheus#​Запросы PromQL]]: Изучение типов данных (счетчики,​ измеряемые величины,​ гистограммы),​ операторов и агрегаций
-  * Пример [[Сервис Prometheus#​prometheus-apache-exporter]] для сбора метрик "​штатного"​ приложения+  * Пример [[Сервис Prometheus#​prometheus-apache-exporter]] для сбора метрик "​штатного"​ приложения, [[Сервис HTTP#​Нагрузочное тестирование]]
   * Service Discovery   * Service Discovery
   * Использование push-модели [[Сервис Prometheus#​prometheus-pushgateway]] и [[Сервис Prometheus#​Отправка метрик из приложения]]   * Использование push-модели [[Сервис Prometheus#​prometheus-pushgateway]] и [[Сервис Prometheus#​Отправка метрик из приложения]]
 +  * prometheus federation
  
 ===== Модуль 3. Централизация логов с Loki ===== ===== Модуль 3. Централизация логов с Loki =====
Line 45: Line 69:
   * Установка [[Сервис Grafana]]   * Установка [[Сервис Grafana]]
   * [[Сервис Grafana#​Подключение Prometheus]] и Loki к Grafana.   * [[Сервис Grafana#​Подключение Prometheus]] и Loki к Grafana.
-  * Использование ​готовых [[Сервис Grafana#Grafana dashboard]] +  * [[Сервис Grafana#​Импорт готовых ​dashboard]] в Grafana 
-  * Создание ​дашборда ​"​Мониторинг сервиса"​ с метриками приложения,​ статусами сервисов от которых оно зависит и виджетами последних ошибок из логов+  * [[Сервис Grafana#​Создание ​dashboard]] ​"​Мониторинг сервиса"​ с метриками приложения,​ статусами сервисов от которых оно зависит и виджетами последних ошибок из логов
   * Типы панелей (Time series, Table, Stat, Logs), настройка внешнего вида и переменных,​ интерактивные дашборды   * Типы панелей (Time series, Table, Stat, Logs), настройка внешнего вида и переменных,​ интерактивные дашборды
  
 ===== Модуль 5. Алертинг и обнаружение проблем ===== ===== Модуль 5. Алертинг и обнаружение проблем =====
  
-  * [[Сервис Prometheus#​prometheus-alertmanager]]  +  * Установка ​[[Сервис Prometheus#​prometheus-alertmanager]]  
-  * [[Сервис Prometheus#​Настройка маршрутизации уведомлений]] (Email, Webhook) +  * [[Сервис Prometheus#​Настройка маршрутизации уведомлений]] (Email, Webhook) ​и [[Сервис Prometheus#​Тестирование alertmanager]] 
-  * [[Сервис Prometheus#Создание правил alertmanager]] ​(например, "сервис ​не отвечает", "много 500-х ошибок"​)+  * [[Сервис Prometheus#Подключение ​готовых ​правил alertmanager]] 
 +  * [[Сервис Prometheus#​Подключение Alertmanager к Prometheus]] 
 +  * [[Сервис ​Prometheus#​Создание правил alertmanager]] ​
   * Управление инцидентами,​ настройка silence (подавление алертов),​ агрегация нотификаций   * Управление инцидентами,​ настройка silence (подавление алертов),​ агрегация нотификаций
-  * Grafana ​Alerting, настройка ​алертов непосредственно в интерфейсе Grafana+  * [[Сервис ​Grafanaастройка ​уведомлений]] ​непосредственно в интерфейсе Grafana ​(вместе с оценкой пороговых значений,​ на примере [[Сервис Prometheus#​Отправка метрик из приложения]])
  
 ===== Идеи для курса ===== ===== Идеи для курса =====
prometheus_grafana_loki_-_observability.1778756786.txt.gz · Last modified: 2026/05/14 14:06 by val