====== Мониторинг кластера Kubernetes ======
* [[https://habr.com/ru/companies/slurm/articles/516748/|Мониторинг кластера Kubernetes: общий обзор и знакомство с Prometheus]]
* [[https://habr.com/ru/articles/766102/|Prometheus + Loki + Grafana: отслеживаем состояния k8s и запущенных в нём приложении]]
* [[https://it-lux.ru/monitoring-as-code-via-gitops-victoriametrics-loki-%D0%B8-grafana-%D0%B2-kubernetes/|Monitoring as Code via GitOps: VictoriaMetrics, Loki и Grafana в Kubernetes]]
* [[https://selectel.ru/blog/tutorials/monitoring-in-k8s-with-prometheus/|selectel Мониторинг в K8s с помощью Prometheus]]
* [[https://www.groundcover.com/blog/kubernetes-observability|Kubernetes Observability Guide: Best Practices & Tools]]
* [[https://sysdig.com/blog/how-to-monitor-kubelet/|How to Monitor the Kubelet]]
* [[https://valyala.medium.com/how-to-use-relabeling-in-prometheus-and-victoriametrics-8b90fc22c4b2|How to use relabeling in Prometheus and VictoriaMetrics]]
===== Реклама =====
* Всем привет! Очередной максимально практический вебинар поможет нам спокойно "забыть" о развернутых в Kubernetes приложениях, и "вспомнить" о них не тогда, когда что-то пойдет не так, а как только появятся предпосылки для этого. Научимся использовать популярные решения Prometheus, VictoriaMetrics, Loki и Grafana
===== Техническое задание =====
* Выяснить, что и зачем нужно мониторить в Kubernetes
* Настроить мониторинг (monitoring) и наблюдаемость (observability) компонентов кластера и приложений
* Обеспечить визуализацию происходящих в кластере процессов
===== Запись вебинара =====
* Тэги: Kubernetes, Monitoring, Observability, Metrics Server, VictoriaMetrics, Prometheus, Grafana
* https://youtu.be/qYKvsOFcpf4
* https://rutube.ru/video/private/5bfc09467bd36c30276600e7b17b3bfc/
===== Методическая подготовка =====
===== Шаг 1. Что у нас есть для начала =====
* [[DevOps2. Использование Kubernetes]]
* [[Система Kubernetes#Dynamic Volume Provisioning]]
===== Шаг 2. Штатные средства =====
* Используем [[Система Kubernetes#Базовые объекты k8s]] для стресс тестирования из [[Основы администрирования систем Linux#Модуль 11. Анализ производительности и оптимизация системы]] и генерации журналов
==== Журналы ====
kube1# kubectl logs pods/my-debian -f
* [[Стратегии деплоя в Kubernetes#Добавление журналов]]
==== Ресурсы CPU/Memory ====
kube1:~# kubectl describe nodes kubeN
===== Шаг 2. Metrics Server =====
* [[Система Kubernetes#Metrics Server]]
===== Шаг 3. VictoriaMetrics =====
* [[Сервис VictoriaMetrics]]
===== Вопросы =====