User Tools

Site Tools


prometheus_grafana_loki_-_observability

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
prometheus_grafana_loki_-_observability [2026/05/14 13:07]
val [Модуль 2. Сбор и анализ метрик с Prometheus]
prometheus_grafana_loki_-_observability [2026/05/27 09:24] (current)
val [Модуль 2. Сбор и анализ метрик с Prometheus]
Line 13: Line 13:
  
   * Настроить учет работы систем,​ сервисов и сетей предприятия с точки зрения:​ метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA)   * Настроить учет работы систем,​ сервисов и сетей предприятия с точки зрения:​ метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA)
 +
 +===== После окончания обучения слушатель будет знать =====
 +
 +  * Фундаментальные понятия мониторинга ​
 +  * Показатели качества (SLI/​SLO/​SLA)
 +  * Технические термины мониторинга
 +  * Основные этапы мониторинга
 +
 +===== После окончания обучения слушатель будет уметь =====
 +
 +  * Разворачивать стек продуктов Prometheus, Grafana, Loki
 +  * Настраивать сбор метрик в Prometheus с использование exporter
 +  * Автоматизировать поиск и добавлять собственные источники метрик
 +  * Использровать язык запросов PromQL для анализа и визуализации измерений
 +  * Настраивать сбор, фильтрацию и анализ журналов с использованием Loki и языка LogQL
 +  * Использовать готовые и создавать собственные dashboard в Grafana
 +  * Настраивать уведомления в Prometheus Alertmanager с использованием готовых и собственных правил
 +  * Настраивать маршрутизацию уведомлений с использованием Email и Webhook
 +  * Настраивать уведомления в Grafana
  
 ===== Модуль 1. Основы наблюдаемости и архитектура стека ===== ===== Модуль 1. Основы наблюдаемости и архитектура стека =====
Line 23: Line 42:
   * Метрики,​ Логи, Трейсы,​ Чем отличается мониторинг от наблюдаемости   * Метрики,​ Логи, Трейсы,​ Чем отличается мониторинг от наблюдаемости
   * Роль каждого компонента (Prometheus,​ Grafana, Loki) в экосистеме   * Роль каждого компонента (Prometheus,​ Grafana, Loki) в экосистеме
 +
 +==== Практика ====
 +
 +  * Развертывание стенда предприятия
  
  
Line 28: Line 51:
  
   * Установка [[Сервис Prometheus]]   * Установка [[Сервис Prometheus]]
-  * Настройка экспортера ([[Сервис Prometheus#​prometheus-node-exporter]] для метрик ОС)принцип pull-модели+  * Использование ​экспортеров, принцип pull-модели  
 +  * Пример ​[[Сервис Prometheus#​prometheus-node-exporter]] для ​сбора ​метрик ОС, оценка загрузки CPU, RAM, сети, задержки ввода/​вывода
   * Язык [[Сервис Prometheus#​Запросы PromQL]]: Изучение типов данных (счетчики,​ измеряемые величины,​ гистограммы),​ операторов и агрегаций   * Язык [[Сервис Prometheus#​Запросы PromQL]]: Изучение типов данных (счетчики,​ измеряемые величины,​ гистограммы),​ операторов и агрегаций
-  * Оценка загрузки CPU, RAM, сети, задержки ввода/​вывода +  * Пример [[Сервис Prometheus#​prometheus-apache-exporter]] для сбора метрик "штатного"​ приложения, ​[[Сервис ​HTTP#Нагрузочное тестирование]]
-  * [[Сервис ​Prometheus#prometheus-apache-exporter]]+
   * Service Discovery   * Service Discovery
-  * Настройка экспортера ([[Сервис Prometheus#​prometheus-pushgateway]] и [[Сервис Prometheus#Пример сбора метрик из приложения]], которое работает периодически,​ использование push-модели+  * Использование push-модели [[Сервис Prometheus#​prometheus-pushgateway]] и [[Сервис Prometheus#Отправка метрик из приложения]] 
 +  * prometheus federation
  
 ===== Модуль 3. Централизация логов с Loki ===== ===== Модуль 3. Централизация логов с Loki =====
Line 45: Line 69:
   * Установка [[Сервис Grafana]]   * Установка [[Сервис Grafana]]
   * [[Сервис Grafana#​Подключение Prometheus]] и Loki к Grafana.   * [[Сервис Grafana#​Подключение Prometheus]] и Loki к Grafana.
-  * Создание ​[[Сервис Grafana#Grafana dashboard]],​ типы ​панелей (Time series, Table, Stat, Logs), настройка внешнего вида и переменных, интерактивные дашборды +  * [[Сервис Grafana#Импорт готовых ​dashboard]] ​в Grafana 
-  * Пример дашборда "​Мониторинг сервиса"​ с метриками приложения,​ статусами сервисов от которыых оно зависит и виджетами последних ошибок из логов+  * [[Сервис Grafana#Создание dashboard]] ​"​Мониторинг сервиса"​ с метриками приложения,​ статусами сервисов от которых оно зависит и виджетами последних ошибок из логов 
 +  * Типы панелей (Time series, Table, Stat, Logs), настройка внешнего вида и переменных,​ интерактивные дашборды
  
 ===== Модуль 5. Алертинг и обнаружение проблем ===== ===== Модуль 5. Алертинг и обнаружение проблем =====
  
-  * [[Сервис Prometheus#​prometheus-alertmanager]]  +  * Установка ​[[Сервис Prometheus#​prometheus-alertmanager]]  
-  * [[Сервис Prometheus#​Настройка маршрутизации уведомлений]] (Email, Webhook) +  * [[Сервис Prometheus#​Настройка маршрутизации уведомлений]] (Email, Webhook) ​и [[Сервис Prometheus#​Тестирование alertmanager]] 
-  * [[Сервис Prometheus#Создание правил alertmanager]] ​(например, "сервис ​не отвечает", "много 500-х ошибок"​)+  * [[Сервис Prometheus#Подключение ​готовых ​правил alertmanager]] 
 +  * [[Сервис Prometheus#​Подключение Alertmanager к Prometheus]] 
 +  * [[Сервис ​Prometheus#​Создание правил alertmanager]] ​
   * Управление инцидентами,​ настройка silence (подавление алертов),​ агрегация нотификаций   * Управление инцидентами,​ настройка silence (подавление алертов),​ агрегация нотификаций
-  * Grafana ​Alerting, настройка ​алертов непосредственно в интерфейсе Grafana+  * [[Сервис ​Grafanaастройка ​уведомлений]] ​непосредственно в интерфейсе Grafana ​(вместе с оценкой пороговых значений,​ на примере [[Сервис Prometheus#​Отправка метрик из приложения]])
  
 ===== Идеи для курса ===== ===== Идеи для курса =====
prometheus_grafana_loki_-_observability.1778753223.txt.gz · Last modified: 2026/05/14 13:07 by val