====== Prometheus и Grafana для системного администратора ======
===== Анонс мастер класса =====
* [[https://www.specialist.ru/news/5547/razvertivanie-i-nastrojka-prometheus-i-grafana-besplatnij-onlajnpraktikum-dlya-sistemnih-administratorov|Развертывание и настройка Prometheus и Grafana: бесплатный онлайн-практикум для системных администраторов]]
===== Запись мастер класса =====
* [[https://youtu.be/RBCEef43FBQ]]
===== Реклама мастер класса =====
* Всем привет! Лично я поддерживаю "[[https://habr.com/ru/post/282674/|Совет 1: изучайте по крайней мере один новый язык программирования каждый год]]" из перевода хорошей статьи на Хабр. Правда, я уже давно ушел из прогаммистов в системные администраторы и задачи у меня теперь другие. Например, я могу настроить мониторинг чего угодно используя Zabbix, но, почему бы не попробовать что-то новое? Почему Prometheus все чаще упоминается как лучшая система мониторинга? Почему Grafana рекомендуется как средство визуализации даже для Zabbix, у которого свои средства хороши? Не пропускаю ли я что-то действительно интересное, гибкое, простое?
===== Техническое задание =====
* Настроить мониторинг и уведомление о проблемах в сети предприятия.
Интересует:
- Доступность ресурсов Интернет для пользователей
- Загрузка канала в Интернет с уведомлением о достижении порогового значения
- Доступность сетевого оборудования предприятия
- Количество клиентов сервиса DHCP
===== Методические рекомендации =====
* Провести мастеркласс в соответствуии с планом лабоаторных работ курса [[Linux. Мониторинг оборудования и интеграция с Cisco]]
===== Шаг 1. Исходное состояние стенда =====
* [[Оборудование уровня 3 Cisco Router]] с DHCP
router#show ip dhcp binding
* [[Оборудование уровня 2 Cisco Catalyst]] только IP
router#ping switchN
* Подключение Vbox VM win client1 с общим буфером обмена и chrome для grafana
C:\>ping ya.ru
* [[Linux. Мониторинг оборудования и интеграция с Cisco#2.3 Настройка базовой конфигурации server]]
* [[Сервис SNMP#Установка пакета net-snmp]]
===== Шаг 2. Знакомство с принципами Prometheus =====
* [[Сервис Prometheus]]
* [[Сервис Prometheus#prometheus-node-exporter]]
===== Шаг 3. Мониторинг с использованием SNMP и визуализация результатов =====
* [[Сервис SNMP#Установка пакета net-snmp]]
* [[Сервис SNMP#Варианты использования snmp консоли в режиме чтения]] (начиная с ifDescr)
* [[Сервис Prometheus#prometheus-snmp-exporter]]
* [[Сервис Grafana]] (до настройки уведомлений)
* [[Утилита iPerf]]
===== Шаг 4. Добавление собственных источников данныз для мониторинга =====
* [[Общие настройки сетевого оборудования Cisco#Настройка rcmd сервисов]] на Cisco router
* [[Сервисы TELNET RSH#Установка клиента]] rsh
server# rsh router show ip dhcp binding
* [[Сервис Prometheus#prometheus-pushgateway]]
* [[Сервис DHCP#Поиск посторонних DHCP серверов]]
===== Шаг 5. Мониторинг доступности сервисов и уведомления о событиях =====
* [[Сервис Prometheus#prometheus-blackbox-exporter]] (check_http и check_ping)
* [[Сервис MTA#Установка и настройка MTA на обработку почты домена hostname]], [[http://mail.isp.un]]
* [[Сервис Prometheus#prometheus-alertmanager]] (можно без CriticalTraffic)
* Сервис Grafana [[Сервис Grafana#Настройка уведомлений]]
* [[Утилита iPerf]]