This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
prometheus_grafana_loki_-_observability_инфраструктуры [2026/04/13 06:06] val |
prometheus_grafana_loki_-_observability_инфраструктуры [2026/04/13 11:24] (current) val |
||
|---|---|---|---|
| Line 1: | Line 1: | ||
| ====== Prometheus, Grafana, Loki - Observability инфраструктуры ====== | ====== Prometheus, Grafana, Loki - Observability инфраструктуры ====== | ||
| + | |||
| + | ===== Реклама ===== | ||
| + | |||
| + | * Мониторинг не нужен, если он формален и не нацелен на бизнес-результат | ||
| + | * Observability — переход от простого сбора метрик к пониманию влияния ИТ-инфраструктуры на бизнес-показатели, прогнозированию сбоев и автоматизации реагирования | ||
| + | * Бизнес-метрики - мониторинг не сервисов, а действий пользователя (например, количество успешных подключений) | ||
| + | * Умные оповещения - должны приходить только при реальной угрозе для сервиса а не по каждому незначительному отклонению | ||
| + | * Автоматизация - запуск процедур восстановления параллельно с уведомлениями инженеров | ||
| + | |||
| + | ===== Техническое задание ===== | ||
| + | |||
| + | * Настроить учет работы систем, сервисов и сетей предприятия с точки зрения: метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA) | ||
| ===== Модуль 1. Основы наблюдаемости и архитектура стека ===== | ===== Модуль 1. Основы наблюдаемости и архитектура стека ===== | ||
| ==== Теория ==== | ==== Теория ==== | ||
| + | |||
| + | * [[https://habr.com/ru/articles/956318/|SLA, SLO, SLI простыми словами и с примерами]] | ||
| * SLA (Service Level Agreement) и SLO (Service Level Objective) | * SLA (Service Level Agreement) и SLO (Service Level Objective) | ||
| Line 37: | Line 51: | ||
| * Управление инцидентами, настройка silence (подавление алертов), агрегация нотификаций | * Управление инцидентами, настройка silence (подавление алертов), агрегация нотификаций | ||
| * Grafana Alerting, настройка алертов непосредственно в интерфейсе Grafana | * Grafana Alerting, настройка алертов непосредственно в интерфейсе Grafana | ||
| + | |||
| + | ===== Черновик ===== | ||
| + | |||
| + | * Процент и время задержки писем через greylist | ||