====== Мониторинг кластера Kubernetes ====== * [[https://habr.com/ru/companies/slurm/articles/516748/|Мониторинг кластера Kubernetes: общий обзор и знакомство с Prometheus]] * [[https://habr.com/ru/articles/766102/|Prometheus + Loki + Grafana: отслеживаем состояния k8s и запущенных в нём приложении]] * [[https://it-lux.ru/monitoring-as-code-via-gitops-victoriametrics-loki-%D0%B8-grafana-%D0%B2-kubernetes/|Monitoring as Code via GitOps: VictoriaMetrics, Loki и Grafana в Kubernetes]] * [[https://selectel.ru/blog/tutorials/monitoring-in-k8s-with-prometheus/|selectel Мониторинг в K8s с помощью Prometheus]] * [[https://www.groundcover.com/blog/kubernetes-observability|Kubernetes Observability Guide: Best Practices & Tools]] * [[https://sysdig.com/blog/how-to-monitor-kubelet/|How to Monitor the Kubelet]] * [[https://valyala.medium.com/how-to-use-relabeling-in-prometheus-and-victoriametrics-8b90fc22c4b2|How to use relabeling in Prometheus and VictoriaMetrics]] ===== Реклама ===== * Всем привет! Очередной максимально практический вебинар поможет нам спокойно "забыть" о развернутых в Kubernetes приложениях, и "вспомнить" о них не тогда, когда что-то пойдет не так, а как только появятся предпосылки для этого. Научимся использовать популярные решения Prometheus, VictoriaMetrics, Loki и Grafana ===== Техническое задание ===== * Выяснить, что и зачем нужно мониторить в Kubernetes * Настроить мониторинг (monitoring) и наблюдаемость (observability) компонентов кластера и приложений * Обеспечить визуализацию происходящих в кластере процессов ===== Запись вебинара ===== * Тэги: Kubernetes, Monitoring, Observability, Metrics Server, VictoriaMetrics, Prometheus, Grafana * https://youtu.be/qYKvsOFcpf4 * https://rutube.ru/video/private/5bfc09467bd36c30276600e7b17b3bfc/ ===== Методическая подготовка ===== ===== Шаг 1. Что у нас есть для начала ===== * [[DevOps2. Использование Kubernetes]] * [[Система Kubernetes#Dynamic Volume Provisioning]] ===== Шаг 2. Штатные средства ===== * Используем [[Система Kubernetes#Базовые объекты k8s]] для стресс тестирования из [[Основы администрирования систем Linux#Модуль 11. Анализ производительности и оптимизация системы]] и генерации журналов ==== Журналы ==== kube1# kubectl logs pods/my-debian -f * [[Стратегии деплоя в Kubernetes#Добавление журналов]] ==== Ресурсы CPU/Memory ==== kube1:~# kubectl describe nodes kubeN ===== Шаг 2. Metrics Server ===== * [[Система Kubernetes#Metrics Server]] ===== Шаг 3. VictoriaMetrics ===== * [[Сервис VictoriaMetrics]] ===== Вопросы =====