User Tools

Site Tools


prometheus_grafana_loki_-_observability_инфраструктуры

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
prometheus_grafana_loki_-_observability_инфраструктуры [2026/04/13 06:06]
val
prometheus_grafana_loki_-_observability_инфраструктуры [2026/04/13 11:24] (current)
val
Line 1: Line 1:
 ====== Prometheus, Grafana, Loki - Observability инфраструктуры ====== ====== Prometheus, Grafana, Loki - Observability инфраструктуры ======
 +
 +===== Реклама =====
 +
 +  * Мониторинг не нужен, если он формален и не нацелен на бизнес-результат
 +  * Observability — переход от простого сбора метрик к пониманию влияния ИТ-инфраструктуры на бизнес-показатели,​ прогнозированию сбоев и автоматизации реагирования
 +  * Бизнес-метрики - мониторинг не сервисов,​ а действий пользователя (например,​ количество успешных подключений)
 +  * Умные оповещения - должны приходить только при реальной угрозе для сервиса а не по каждому незначительному отклонению
 +  * Автоматизация - запуск процедур восстановления параллельно с уведомлениями инженеров
 +
 +===== Техническое задание =====
 +
 +  * Настроить учет работы систем,​ сервисов и сетей предприятия с точки зрения:​ метрик (Service Level Indicator - SLI), целей команды предприятия (Service Level Objective - SLO) и гарантий для клиентов (Service Level Agreement - SLA)
  
 ===== Модуль 1. Основы наблюдаемости и архитектура стека ===== ===== Модуль 1. Основы наблюдаемости и архитектура стека =====
  
 ==== Теория ==== ==== Теория ====
 +
 +  * [[https://​habr.com/​ru/​articles/​956318/​|SLA,​ SLO, SLI простыми словами и с примерами]]
  
   * SLA (Service Level Agreement) и SLO (Service Level Objective)   * SLA (Service Level Agreement) и SLO (Service Level Objective)
Line 37: Line 51:
   * Управление инцидентами,​ настройка silence (подавление алертов),​ агрегация нотификаций   * Управление инцидентами,​ настройка silence (подавление алертов),​ агрегация нотификаций
   * Grafana Alerting, настройка алертов непосредственно в интерфейсе Grafana   * Grafana Alerting, настройка алертов непосредственно в интерфейсе Grafana
 +
 +===== Черновик =====
 +
 +  * Процент и время задержки писем через greylist
prometheus_grafana_loki_-_observability_инфраструктуры.1776049613.txt.gz · Last modified: 2026/04/13 06:06 by val