Zabbix. Мониторинг IT инфраструктуры предприятия
Цель обновления
Оптимизировать программу
Мониторинг Linux/Windows рабочих станций
Ссылка на вебинар
Программа курса
Модуль 0. Подготовка стенда в классе
Модуль 1: Развертывание IT инфраструктуры предприятия
Теория
Лабораторные работы: Развертывание объектов мониторинга
1.1 Схема стенда, импорт, настройка и запуск VM gate и server
Запустите с правами Administrator
C:\cmder\Cmder.exe
λ bash
λ cd
λ git clone http://val.bmstu.ru/unix/conf.git
λ cd conf/virtualbox/
!!! 5 - это номер курса, вместо X укажите Ваш номер стенда, если не помните, спросите преподавателя !!!
λ ./setup.sh X 5
1.2 Настройка сети VM gate и server
# sh net_gate.sh
# init 6
# sh net_server.sh
# init 6
1.3 настройка сервисов DNS и DHCP
Сервис DHCP (понадобится в лабораторной работе про LLD)
gate:~# sh conf/dhcp.sh
server:~# sh conf/dns.sh
Настройка клиента
DNS на gate и server
# cat /etc/resolv.conf
search corpX.un
nameserver 192.168.X.10
# nslookup ns
Модуль 2: Установка компонентов Zabbix
Теория
Лабораторные работы: Развертывание компонентов Zabbix
Вопросы
Какие СУБД используются для хранения данных в Zabbix?
Какая версия Zabbix поддерживается в течении долгого времени?
Какой веб сервер может использоваться для работы Zabbix Frontend?
Для каких задач используется Zabbix Frontend?
Для каких задач используется Zabbix Server?
Что содержит пакет zabbix-sql-scripts?
На каком языке программирования написан Zabbix Frontend?
На каком языке программирования написан Zabbix Server?
Модуль 3: Базовые сущности Zabbix
Теория
Лабораторные работы: Базовые элементы процесса мониторинга
3.1 Простые проверки в Zabbix
Host name: ya.ru
ЛЮБОЙ ИНТЕРФЕЙС: DNS ya.ru
New group: External Hosts
Monitoring->Hosts->Latest data
ya.ru->check perf http ya.ru
Zoom: 1h
3.2 Web сценарии
server# apt install ansible
server# ansible-playbook conf/ansible/roles/mail.yml
3.3 Триггеры в Zabbix
Преподаватель демонстрирует
Настройка триггеров уведомляющего о недоступности gate.isp.un и rdp сервиса
Настройка триггеров уведомляющего о недоступности ya.ru (обсудить использование встроенных макросов в именах триггеров и вернуться к этому вопросу в модуле 4 при клонировании ya.ru в val.bmstu.ru
gate:~# ifdown eth1
Monitoring->Triggers
или
Monitoring->Problems
gate:~# ifup eth1
Вопросы
Для чего используются объекты Hosts в Zabbix?
Для чего используются объекты Items в Zabbix?
Для чего используются объекты Triggers в Zabbix?
Какие атрибуты помечены как обязательные при создании Host в Zabbix?
Какие интерфейсы для взаимодействия с узлами поддерживает Zabbix?
Перечислите обязательные атрибуты Items в Zabbix?
Есть ли возможность осуществлять мониторинг системы, не имеющей поддерживаемых Zabbix интерфейсов?
Какого типа Items используется для проверок ICMP Echo
Откуда берется адрес целевой системы, если он не указан явно в элементе типа Simple Check?
Какие значения хранятся в Трендах?
За какой период рассчитываются значения Трендов?
Какие атрибуты помечены как обязательные при создании Trigger в Zabbix?
Что следует использовать для уменьшения количества сообщений системы мониторинга в случае сбоев больших коммутационных узлов?
Какие возможности, по сравнению с net.tcp.service.perf[http] предоставляют Web сценарии?
Где описываются Items в Web сценарии?
Можно ли мониторить работоспособность неуправляемого коммутатора?
Модуль 4: Использование шаблонов
Теория
Лабораторные работы: Управление конфигурацией с помощью шаблонов
4.1 Клонирование узлов (хостов)
4.2 Использование zabbix agent для сбора метрик
4.3 Использование готовых шаблонов
Обзор шаблона “Linux by Zabbix agent” (выяснить, куда делось наследование шаблонов и кто знает про agent.ping из “Zabbix agent”)
Добавление узла gate.corpX.un в мониторинг и применение к нему шаблона “Linux by Zabbix agent”
Преподаватель демонстрирует вариант безопасного подключения к агенту с использованием механизма PSK (лучше в конце 7-го модуля)
Мониторинг с использованием Zabbix agents на server.corpX.un - комментируем или исправляем Hostname=server.corpX.un и добавляем к нему шаблон “Linux by Zabbix agent” (лучше в конце курса, что бы было проще видеть свои items)
Обзор шаблона “Zabbix server health” и применение его к узлу server.corpX.un (лучше в конце курса)
4.4 Создание шаблона на основе существующего
Переопределяем значение макроса {$SSH_PORT}, указав значение, например, 2222 для узла gate.corpX.un и ждем (рассчитать время) срабатывания триггера
После срабатывания триггера, в (
Настройка ssh сервера) на gate указываем новый порт и перезапускаем сервис или, методически, проще использовать эти команды:
gate# /usr/sbin/sshd -p 2222
gate# kill `cat /var/run/sshd.pid`
Вопросы
Чем Clone объекта Host отличается от Full Clone?
Для чего нужен Zabbix Agent?
Какой командой можно получить список метрик (ключей), возвращаемых zabbix agent?
Какой утилитой можно получить значения метрик (ключей) с zabbix agent
Какая метрика (ключ) zabbix agent используется для отображения статуса узла?
Перечислите варианты безопасного подключения между zabbix агентом и сервером?
Чем шаблоны лучше клонирования?
Что следует использовать в именах триггеров при описании их в шаблонах или при клонировании узлов?
Что можно использовать в качестве переменных в выражениях элементов?
Как работает переопределение и наследование макросов?
Какой синтаксис у built-in макросов?
Какой синтаксис у user-defined макросов?
Что произойдет с объектами узла, при изменении описывающего их шаблона?
Можно ли поменять параметры объекта узла, описанного шаблоном?
Если поменять параметры объекта узла, описанного шаблоном, а потом те же в шаблоне, какие значения будут в итоге?
Если поменять параметры объекта на уровне шаблона, а потом на уровне узла, какие значения будут в итоге?
Модуль 5: Управление учетными записями и уведомлениями
Теория
Лабораторные работы: Настройка уведомлений о событиях
5.1 Добавление учетных записей администраторов
5.2 Настройка уведомлений о событиях
http://192.168.X.10/mail/
5.3 Добавление учетных записей сотрудников службы поддержки
Задание на дом:)
Создать группу “Zabbix responsible”
Назначить группе “Zabbix responsible” права на чтение элементов групп Linux servers и/или External Hosts (!!! это нужно и для получение уведомлений о срабатывании триггеров этих узлов)
Настроить Trigger Action “Zabbix responsible notification” для уведомлений пользователей группы “Zabbix responsible”
Создать учетную запись user1/Pa$$w0rd1 с Role: “User role” и включить его в группу “Zabbix responsible”
user1 должен иметь права на просмотр результатов мониторинга через Web интерфейс и должен получать уведомления по электронной почте (
Добавление учетной записи).
5.4 Настройка публичного доступа к информации в Zabbix
Пользователя guest убрать из группы Disabled
-
Предоставить группе Guests права на чтение элементов объектов мониторинга (сделать отдельную группу Public info и включить в нее узлы, элементы которых будут доступны публично)
Вопросы
Укажите все шаги, необходимые для оправки уведомлений пользователям Zabbix
Роль Guest, User, Admin, SuperAdmin позволяет …
Как может быть использовано членство в группе Zabbix?
Укажите все типы (Type) отправки уведомлений в Zabbix
Для чего нужны права на группы узлов пользователям Zabbix?
Где можно посмотреть, какие уведомления были отправлены Zabbix?
Права какого пользователя используются в Zabbix при подключении к его интерфейсу без авторизации?
Модуль 6: Внешние проверки и пользовательские параметры
Теория
Лабораторные работы: Мониторинг с использование внешних программ/скриптов
6.1 Варианты получения результатов из внешних программ/скриптов на zabbix сервере
Демонстрирует преподаватель
-
Пример простого скрипта (на этапе добавления элемента тестируем с разным количеством итераций до появления Timeout)
Делаем все, но не запускаем)))
6.2 Варианты получения результатов из внешних программ/скриптов на удаленных узлах
Демонстрирует преподаватель (сделаем качественнее в следующем модуле)
-
-
Использование UserParameter в zabbix-agent для получения результатов из внешних приложений, на примере мониторинга количества выданных ip сервисом DHCP
-
Вопросы
Какое ограничение накладывает Zabbix server на выполнение внешних скриптов?
Какое ограничение накладывает Zabbix agent на выполнение внешних скриптов?
Какой синтаксис UserParameter позволяет указать произвольное число аргументов?
На что влияет UnsafeUserParameters?
Какие варианты имеются для запуска скриптов на удаленных системах из Zabbix?
Как можно передать в Zabbix результаты, получаемые в течении длительного времени?
Модуль 7: Низкоуровневое обнаружение (LLD)
Теория
Лабораторные работы: Управление конфигурацией с помощью шаблонов и LLD
7.1 Знакомство с LLD
Configuration->Hosts->gate.corpX.un
->Discovery rules
->Block devices discovery: ...
->Mounted filesystem discovery: ...
->Network interface discovery: ...
Фильтрация элементов
Zabbix ⇐ 4
Administration->General->Regular expressions
Zabbix >= 5 - унаследованные макросы ({$VFS.FS.FSTYPE.MATCHES}, например)
7.2 Использование LLD для учета статистики выданных адресов по DHCP в множестве подсетей
Демонстрирует преподаватель
gate# cat /etc/network/interfaces
gate# ifup eth2
gate# cat /etc/default/isc-dhcp-server
gate# cat /etc/dhcp/dhcpd.conf
gate# service isc-dhcp-server restart
gate# git clone https://github.com/valbmsturu/zabbix_dhcp_pools.git
gate# cd zabbix_dhcp_pools/
gate# ./install.sh
server# apt install jq
server# zabbix_get -s gate -k dhcp.pools.discovery | jq
server# zabbix_get -s gate -k dhcp.pools.shared-network[LAN1,used]
Вопросы
В каком формате должен возвращать данные элемент discovery?
Какой синтаксис у low-level discovery макросов?
Перечислите форматы, используемые для импорта/экспорта объектов Zabbix?
Придумайте свои варианты задач, при которых может понадобиться LLD.
Как можно отфильтровать только нужные элементы в процессе discovery?
Модуль 8: Автоматическая регистрация и инвентаризация компьютеров
Теория
Лабораторные работы: Мониторинг и инвентаризация систем с динамическими адресами
8.1 Установка агента на Windows client
Для редактирования конфигурации потребуется установить
nodepad++, запустить сразу после инсталляции (будет/нужен с правами Администратора) и открыть файл C:\Program Files\Zabbix Agent\zabbix_agentd.conf
8.2 Установка агента на Linux client
8.3 Проблемы мониторинга рабочих станций Linux и Window
Windows firewall, не хотим настраивать исключения.
Может измениться IP адрес (для демонстрации можно сменить mac адрес)
LLD использует имя системы, и, если его нет в
DNS - не работает, согласно записям в журнале:
# grep 192.168.X.102 /var/log/zabbix/zabbix_server.log
...
12202:20190605:125020.551 cannot send list of active checks to "192.168.X.102": host [CLIENT1] not found
...
8.4 Использование активного режима агента
8.5 Получение списка ПО на Linux и Windows
server# zabbix_get -s 192.168.X.1NN -p 10050 -k listinstalledsoft
8.6 Настройка инвентаризации
Разработка шаблона “Template
OS Windows list installed soft Active” с элементом listinstalledsoft, заполняющим инвентарное поле “Software (Full details)” и триггером, информирующем об изменении состава установленного ПО, используя
Пример с текстовым элементом
conf/zabbix/zabbix/Template_OS_Windows_list_installed_soft_Active_5.xml
(!!! не смотря на название, подходит для Linux :)
Вопросы
Чем отличается активный режим от пассивного в Zabbix агенте?
Что означают директивы Server, ServerActive, StartAgents в конфигурации Zabbix агента?
Перечислите обязательные действия при авто регистрации узлов?
Как отличить рабочие станции Linux от Windows при авто регистрации?
Придумайте варианты конфигураций сети, при которых необходимо использовать активный режим агента Zabbix
Модуль 9: Мониторинг систем по протоколу SNMP
Теория
Лабораторные работы: Мониторинг сетевого оборудования
9.1 Развертывание сетевого оборудования с поддержкой SNMP
Демонстрирует преподаватель
configure terminal
hostname routerN
interface FastEthernet0/0
ip address 172.16.1.19N 255.255.255.0
duplex full
no shutdown
ip route 0.0.0.0 0.0.0.0 172.16.1.254
ip name-server 172.16.1.254
ip domain-name isp.un
ip domain-lookup
snmp-server community public RO
end
copy running-config startup-config
9.2 Настройка интерфейса SNMP в системах
9.3 Настройка мониторинга систем по протоколу SNMP в zabbix
Демонстрирует преподаватель (для ускорения демонстрации уменьшить интервалы времени до 1 минуты)
9.4 Автоматический поиск и добавление устройств в Zabbix
9.5 Использование Zabbix proxy для решения проблем с доступом к объектам мониторинга
!!!Работает с задержкой!!!
configure terminal
no ip route 0.0.0.0 0.0.0.0 172.16.1.254
Вопросы
Что необходимо добавить в систему с Zabbix Server или Proxy для мониторинга оборудования по протоколу SNMP с использованием имен OID в текстовом формате?
В чем отличие процесса автоматического добавления оборудования в этой лабораторной работе от варианта с активным агентом?
Для каких задач используется Zabbix Proxy?
В каком режиме работает Zabbix Proxy по умолчанию?
Придумайте свои варианты задач, при которых может понадобиться Zabbix Proxy
Модуль 10: Zabbix API
Теория
Лабораторные работы: Пример задачи, использующей Zabbix API
10.1 Подключение и аутентификация
10.2 Примеры запросов на чтение информации о настройках объектов мониторинга
10.3 Пример изменения конфигурации объектов мониторинга через Zabbix API
10.4 Пример практического использования технологии
Вопросы
Можно ли использовать Zabbix
API для получения результатов мониторинга?
Можно ли использовать Zabbix
API для управления конфигурацией?
Что необходимо получить перед выполнением запросов к Zabbix
API?
Для получения токена доступа используется метод …
Для получения списка узлов используется метод …
Для получения данных мониторинга используется метод …
Для модификации свойств объекта Zabbix используется метод …
user.login host.get history.get map.update
Модуль 11: Дополнительные возможности визуализации результатов мониторинга в Zabbix
Теория
Лабораторные работы
11.1 Использование карт
Icon: Cloud(96)
Label: ISP
Host: gate.corpX.un
Label: {HOST.CONN}
Zabbix <=5
Out: {gate.corpX.un:net.if.out["eth1"].last()}
In: {gate.corpX.un:net.if.in["eth1"].last()}
Download: {server.corpX.un:speedtest.download.last()}
Upload: {server.corpX.un:speedtest.upload.last()}
Zabbix >=6
Out: {?last(/gate.corpX.un/net.if.out["eth1"])}
In: {?last(/gate.corpX.un/net.if.in["eth1"])}
Download: {?last(/server.corpX.un/speedtest.download)}
Upload: {?last(/server.corpX.un/speedtest.upload)}
11.2 Использование панелей (Dashboard)
Обзор возможностей в панели “Zabbix server health”
Создать виджет “Inet Access”
Добавить в него Map: “ISP1”
Добавить в него Graph(classic): ISP1 Network Traffic → ISP1 gate.corpX.un: Interface eth1: Network traffic
Вместо создания классического
Пользовательские графики отображающего скорость интернет канала, добавить в него Graph: “ISP1 Speed”, два Data set: server.corpX.un → speedtest … и Time period: From now-1d
Cделать панель публичной (три черточки в правом верхнем углу → Sharing)
Модуль 12: Обновление Zabbix
# systemctl restart zabbix-server.service
# tail -f /var/log/zabbix/zabbix_server.log
...
443024:20221228:113625.301 current database version (mandatory/optional): 06000000/06000017
443024:20221228:113625.301 required mandatory version: 06020000
443024:20221228:113625.301 optional patches were found
443024:20221228:113625.301 starting automatic database upgrade
443024:20221228:113625.306 completed 0% of database upgrade
443024:20221228:113625.372 completed 1% of database upgrade
...
443024:20221228:113637.733 completed 100% of database upgrade
443024:20221228:113637.734 database upgrade fully completed
...