User Tools

Site Tools


prometheus_grafana_loki_-_observability

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
prometheus_grafana_loki_-_observability [2026/05/14 16:02]
val [Модуль 5. Алертинг и обнаружение проблем]
prometheus_grafana_loki_-_observability [2026/05/27 09:24] (current)
val [Модуль 2. Сбор и анализ метрик с Prometheus]
Line 13: Line 13:
  
   * Настроить учет работы систем,​ сервисов и сетей предприятия с точки зрения:​ метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA)   * Настроить учет работы систем,​ сервисов и сетей предприятия с точки зрения:​ метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA)
 +
 +===== После окончания обучения слушатель будет знать =====
 +
 +  * Фундаментальные понятия мониторинга ​
 +  * Показатели качества (SLI/​SLO/​SLA)
 +  * Технические термины мониторинга
 +  * Основные этапы мониторинга
 +
 +===== После окончания обучения слушатель будет уметь =====
 +
 +  * Разворачивать стек продуктов Prometheus, Grafana, Loki
 +  * Настраивать сбор метрик в Prometheus с использование exporter
 +  * Автоматизировать поиск и добавлять собственные источники метрик
 +  * Использровать язык запросов PromQL для анализа и визуализации измерений
 +  * Настраивать сбор, фильтрацию и анализ журналов с использованием Loki и языка LogQL
 +  * Использовать готовые и создавать собственные dashboard в Grafana
 +  * Настраивать уведомления в Prometheus Alertmanager с использованием готовых и собственных правил
 +  * Настраивать маршрутизацию уведомлений с использованием Email и Webhook
 +  * Настраивать уведомления в Grafana
  
 ===== Модуль 1. Основы наблюдаемости и архитектура стека ===== ===== Модуль 1. Основы наблюдаемости и архитектура стека =====
Line 23: Line 42:
   * Метрики,​ Логи, Трейсы,​ Чем отличается мониторинг от наблюдаемости   * Метрики,​ Логи, Трейсы,​ Чем отличается мониторинг от наблюдаемости
   * Роль каждого компонента (Prometheus,​ Grafana, Loki) в экосистеме   * Роль каждого компонента (Prometheus,​ Grafana, Loki) в экосистеме
 +
 +==== Практика ====
 +
 +  * Развертывание стенда предприятия
  
  
Line 34: Line 57:
   * Service Discovery   * Service Discovery
   * Использование push-модели [[Сервис Prometheus#​prometheus-pushgateway]] и [[Сервис Prometheus#​Отправка метрик из приложения]]   * Использование push-модели [[Сервис Prometheus#​prometheus-pushgateway]] и [[Сервис Prometheus#​Отправка метрик из приложения]]
 +  * prometheus federation
  
 ===== Модуль 3. Централизация логов с Loki ===== ===== Модуль 3. Централизация логов с Loki =====
Line 55: Line 79:
   * [[Сервис Prometheus#​Подключение готовых правил alertmanager]]   * [[Сервис Prometheus#​Подключение готовых правил alertmanager]]
   * [[Сервис Prometheus#​Подключение Alertmanager к Prometheus]]   * [[Сервис Prometheus#​Подключение Alertmanager к Prometheus]]
-  * [[Сервис Prometheus#​Создание правил alertmanager]] ​(например,​ "​сервис не отвечает",​ "​много 500-х ошибок"​)+  * [[Сервис Prometheus#​Создание правил alertmanager]] ​
   * Управление инцидентами,​ настройка silence (подавление алертов),​ агрегация нотификаций   * Управление инцидентами,​ настройка silence (подавление алертов),​ агрегация нотификаций
-  * [[Сервис Grafana#​Настройка уведомлений]] непосредственно в интерфейсе Grafana ​для ​оценки пороговых значений на примере [[Сервис Prometheus#​Отправка метрик из приложения]]+  * [[Сервис Grafana#​Настройка уведомлений]] непосредственно в интерфейсе Grafana ​(вместе с оценкой пороговых значенийна примере [[Сервис Prometheus#​Отправка метрик из приложения]])
  
 ===== Идеи для курса ===== ===== Идеи для курса =====
prometheus_grafana_loki_-_observability.1778763756.txt.gz · Last modified: 2026/05/14 16:02 by val