Состояние кластера

Данный раздел описывает мониторинг состояния кластера Kubernetes. Наблюдение за кластером осуществляется в разделе Инструменты → Мониторинг веб-интерфейса системы.

Раздел доступен администраторам, пользователям, которые имеют соответствующее разрешение в составе своих ролей, а также учетным записям со статусом Суперадминистратор.

О мониторинге состояния кластера

Мониторинг состояния кластера Kubernetes в системе осуществляется с помощью инструмента Grafana, предоставляющего визуализацию собранных метрик. Раздел Инструменты → Мониторинг в веб-интерфейсе системы отображает полную информацию о состоянии кластера, контейнеров, узлов и других компонентов.

Основные возможности раздела:

  • Отслеживание состояния контейнеров, в том числе количества запущенных, ожидающих и завершенных контейнеров, а также статистики перезапусков контейнеров за последние 30 минут.

  • Мониторинг состояния узлов, отображающий количество доступных и недоступных узлов, а также узлов, не готовых к работе.

  • Анализ запросов и доступных ресурсов в кластере, включая поды, CPU и оперативную память.

  • Отображение состояния горизонтального автомасштабирования подов (HPA), заданий (Jobs) и постоянных томов (PVC).

  • Наблюдение за состоянием контроллеров Stateful Set и перезапусками подов.

Секции мониторинга

В разделе Инструменты → Мониторинг представлены различные секции, каждая из которых отображает определенные аспекты работы кластера Kubernetes:

  • Cluster — общие метрики по кластеру, в том числе запросы и доступные ресурсы, такие как поды, CPU и оперативная память.

  • Node — состояние узлов кластера, в том числе их количество, доступность и готовность к работе.

  • Deployments — состояние деплойментов в кластере, в том числе количество реплик и их состояние.

  • Statefulset — состояние контроллеров Stateful Set, в том числе количество реплик и их состояние.

  • Pods — состояние подов, в том числе их количество, статусы выполнения и перезапуска.

  • Containers — состояние контейнеров в кластере.

  • HPA — состояние горизонтального автомасштабирования подов (HPA), в том числе текущее состояние и пределы масштабирования.

  • Jobs — статус заданий в кластере, в том числе количество успешно выполненных, активных и проваленных заданий.

  • PVC — сведения о постоянных томах (PVC), в том числе их связывание и доступность.

Cluster

Секция Cluster содержит метрики по использованию ресурсов кластера:

  • Cluster Pod Requested — доля запрашиваемых подов.

  • Cluster CPU Requested — доля запрашиваемых ядер процессора.

  • Cluster Memory Requested — доля запрашиваемой оперативной памяти.

  • Cluster Pod Capacity — доступная и используемая емкость подов в кластере.

  • Cluster CPU Capacity — доступная и используемая емкость CPU в кластере.

  • Cluster Mem Capacity — доступная и используемая емкость оперативной памяти в кластере.

Node

Секция Node предоставляет информацию о состоянии узлов:

  • Number of Nodes — общее количество узлов в кластере.

  • Nodes Unavailable — количество недоступных узлов.

  • Node NotReady — узлы, не готовые к работе.

  • Node Pressure — узлы, близкие к исчерпанию дискового пространства.

    При необходимости расширить объем дискового пространства для узлов обратитесь к разделу Увеличение размера тома для подов.
  • node number — график количества доступных узлов кластера.

Для получения более полных сведений о состоянии узлов обратитесь к разделу Просмотр журнала событий кластера.

Deployments

Секция Deployments показывает информацию о деплойментах:

  • Deployment Replicas - Up To Date — общие сведения об актуальных репликах деплоймента.

  • Deployment Replicas — количество реплик деплоймента.

  • Deployment Replicas - Updated — количество недавно обновленных реплик.

  • Deployment Replicas - Unavailable — количество недоступных реплик.

Statefulset

Секция Statefulset показывает состояние контроллеров Stateful Set:

  • Statefulset Replicas - Up To Date — общие сведения об актуальных контроллерах Stateful Set.

  • Statefulset replicas — состояние контроллеров Stateful Set.

Pods

Секция Pods отображает состояние подов:

  • Pods restart in 30m — сведения о перезапусках подов за последние 30 минут.

  • Evicted — сведения о подах, вытесненных для освобождения ресурсов.

  • Pods Running — количество работающих подов.

  • Pods Succeeded — количество успешно завершенных подов.

  • Pods Failed — количество подов, контейнеры которых завершили работу с ошибкой.

  • Pods Pending — количество подов, ожидающих запуска.

  • Pods Unknown — количество подов в неизвестном состоянии.

Для получения более полных сведений о состоянии подов обратитесь к разделам Просмотр журнала событий кластера и Просмотр состояния подов кластера.

Containers

Секция Containers отображает состояние контейнеров в кластере:

  • Containers Running — количество запущенных контейнеров.

  • Containers Waiting — количество контейнеров, ожидающих запуска.

  • Containers Terminated — количество завершенных контейнеров.

  • Containers Restarts (Last 30 Minutes) — количество перезапусков контейнеров за последние 30 минут.

  • CPU Cores Requested by Containers — количество ядер процессора, запрашиваемых контейнерами.

  • Memory Requested by Containers — объем оперативной памяти, запрашиваемой контейнерами.

HPA

Секция HPA отображает состояние горизонтального автомасштабирования:

  • hpa — общие сведения об HPA.

  • total-hpa-current — текущее состояние HPA.

  • current==max — сведения о верхнем пределе HPA.

  • current==min — сведения о нижнем пределе HPA.

Jobs

Секция Jobs показывает состояние заданий:

  • Jobs Succeeded — количество успешно завершенных заданий.

  • Jobs Active — количество активных заданий.

  • Jobs Failed — количество проваленных заданий.

  • Job last success time from now — время последнего успешного выполнения задания.

  • Job failed — график проваленных заданий.

PVC

Секция PVC отображает информацию о постоянных томах:

  • pvc is bound — количество запросов PVC, связанных с постоянными томами.

  • pvc is not bound — количество запросов PVC, не связанных с постоянными томами.

  • pvc — общие сведения о PVC.

Настройка мониторинга

В разделе Инструменты → Мониторинг доступны следующие настройки и операции:

Настройка временного периода

Сведения о состоянии кластера отображаются за определенный период времени. По умолчанию информация о кластере отображается за последние 24 часа.

Чтобы изменить временной период мониторинга:

  1. Нажмите на кнопку с текущим временным периодом в правом верхнем углу раздела.

  2. В открывшейся панели задайте новый временной период. Сведения о состоянии кластера в разделе будут обновлены с учетом указанных настроек.

Обновление мониторинга

Чтобы обновить сведения о состоянии кластера, нажмите на кнопку Refresh в правом верхнем углу раздела.

При необходимости вы можете настроить автоматическое обновление сведений мониторинга. Для этого:

  1. Нажмите на кнопку в виде стрелки вниз справа от кнопки Refresh.

  2. Выберите период автоматического обновления.