====== Prometheus и Grafana для системного администратора ====== ===== Анонс мастер класса ===== * [[https://www.specialist.ru/news/5547/razvertivanie-i-nastrojka-prometheus-i-grafana-besplatnij-onlajnpraktikum-dlya-sistemnih-administratorov|Развертывание и настройка Prometheus и Grafana: бесплатный онлайн-практикум для системных администраторов]] ===== Запись мастер класса ===== * [[https://youtu.be/RBCEef43FBQ]] ===== Реклама мастер класса ===== * Всем привет! Лично я поддерживаю "[[https://habr.com/ru/post/282674/|Совет 1: изучайте по крайней мере один новый язык программирования каждый год]]" из перевода хорошей статьи на Хабр. Правда, я уже давно ушел из прогаммистов в системные администраторы и задачи у меня теперь другие. Например, я могу настроить мониторинг чего угодно используя Zabbix, но, почему бы не попробовать что-то новое? Почему Prometheus все чаще упоминается как лучшая система мониторинга? Почему Grafana рекомендуется как средство визуализации даже для Zabbix, у которого свои средства хороши? Не пропускаю ли я что-то действительно интересное, гибкое, простое? ===== Техническое задание ===== * Настроить мониторинг и уведомление о проблемах в сети предприятия. Интересует: - Доступность ресурсов Интернет для пользователей - Загрузка канала в Интернет с уведомлением о достижении порогового значения - Доступность сетевого оборудования предприятия - Количество клиентов сервиса DHCP ===== Методические рекомендации ===== * Провести мастеркласс в соответствуии с планом лабоаторных работ курса [[Linux. Мониторинг оборудования и интеграция с Cisco]] ===== Шаг 1. Исходное состояние стенда ===== * [[Оборудование уровня 3 Cisco Router]] с DHCP router#show ip dhcp binding * [[Оборудование уровня 2 Cisco Catalyst]] только IP router#ping switchN * Подключение Vbox VM win client1 с общим буфером обмена и chrome для grafana C:\>ping ya.ru * [[Linux. Мониторинг оборудования и интеграция с Cisco#2.3 Настройка базовой конфигурации server]] * [[Сервис SNMP#Установка пакета net-snmp]] ===== Шаг 2. Знакомство с принципами Prometheus ===== * [[Сервис Prometheus]] * [[Сервис Prometheus#prometheus-node-exporter]] ===== Шаг 3. Мониторинг с использованием SNMP и визуализация результатов ===== * [[Сервис SNMP#Установка пакета net-snmp]] * [[Сервис SNMP#Варианты использования snmp консоли в режиме чтения]] (начиная с ifDescr) * [[Сервис Prometheus#prometheus-snmp-exporter]] * [[Сервис Grafana]] (до настройки уведомлений) * [[Утилита iPerf]] ===== Шаг 4. Добавление собственных источников данныз для мониторинга ===== * [[Общие настройки сетевого оборудования Cisco#Настройка rcmd сервисов]] на Cisco router * [[Сервисы TELNET RSH#Установка клиента]] rsh server# rsh router show ip dhcp binding * [[Сервис Prometheus#prometheus-pushgateway]] * [[Сервис DHCP#Поиск посторонних DHCP серверов]] ===== Шаг 5. Мониторинг доступности сервисов и уведомления о событиях ===== * [[Сервис Prometheus#prometheus-blackbox-exporter]] (check_http и check_ping) * [[Сервис MTA#Установка и настройка MTA на обработку почты домена hostname]], [[http://mail.isp.un]] * [[Сервис Prometheus#prometheus-alertmanager]] (можно без CriticalTraffic) * Сервис Grafana [[Сервис Grafana#Настройка уведомлений]] * [[Утилита iPerf]]