DCImanager — мультивендорная платформа автоматизации управления оборудованием (часть 2)

12.08.2024

Вигель Антонов, директор технического центра Merlion, продолжает рассказывать про платформу от «ГК Астра». В этой части будут рассмотрены: работа платформы с серверами, преимущества и экосистема ПО DCImanager.

Astra logo
Вигель Антонов

Вигель Антонов

Работа с серверами

Сервер – основная физическая единица, с которой работает платформа. DCImanager позволяет вести учет серверов, управлять их состоянием, статусом и подключениями. ПО поддерживает работу с серверами разных форм-факторов — стоечными и блейдами. При добавлении сервера в DCImanager указывается его форм-фактор.

Стоечные серверы предназначены для установки в стойку и интеграции с другими аппаратными компонентами – RAID-массивами, коммутаторами, распределителями питания (PDU). Стоечный сервер содержит все компоненты, необходимые для его автономной работы — процессоры, модули памяти, жёсткие диски, блоки питания и т.д. Размер сервера измеряется количеством секций стойки — юнитов (U), которое он занимает. Размер сервера в юнитах может быть кратным 0,5.

Блейд-серверы – это серверы, у которых часть аппаратных компонентов вынесена за пределы корпуса. Такая конструкция позволяет существенно сократить размер устройства и размещать больше серверов в одной стойке. Блейд-серверы устанавливаются в шасси (корзину). Шасси – устройство, которое предоставляет блейд-серверам доступ к общим компонентам. Например, блейд-сервер может состоять из системной платы, процессора, модулей памяти и сетевой карты и использовать внешние диски и блоки питания, установленные в шасси.

В DCImanager возможно добавить шасси в стойку через форму добавления сервера. При добавлении шасси задается его размер в юнитах, номера юнитов стойки, в которых оно расположено, и количество слотов под блейд-серверы. При добавлении блейд-сервера в программном обеспечении DCImanager указывается стойка, шасси и номера слотов шасси, в которых он размещен. Для серверов, управляемых ПО, реализовано формирование отчетов с информацией о серверах, добавленных в платформу.

Предусмотрены следующие виды отчетов:

  • Basic Systems Report – базовая информация о сервере;
  • Firmware Report – информация о микпопрограммах BIOS и BMC;
  • Hardware Inventory Report – информация о комплектующих серверов.

Отчеты выгружаются в формате csv.

DCImanager — мультивендорная платформа автоматизации управления оборудованием (часть 2)

Интерфейс программного обеспечения DCImanager. Управление отчетами

Сбор статистических данных

Сбор и обработка статистических данных о функционировании платформы DCImanager, а также визуализации из отображения реализованы на основе сервиса работы с оборудованием DCImanager и дополнительного программного обеспечения:

  • Clickhouse, для сбора и хранения данных статистики;
  • Grafana, для визуализации, мониторинга и анализа данных.

Построение графиков и отображение метрик в интерфейсе DCImanager выполняет программное обеспечение Grafana. Данные статистики и собранные метрики можно посмотреть в карточке устройства.

ПО DCImanager собирает статистику по трафику и энергопотреблению серверов. Статистика по энергопотреблению собирается с портов PDU, к которым подключён сервер.

Статистика по трафику вычисляется одним из способов:

  • по объему трафика с портов коммутатора, к которым подключен сервер;
  • по данным протокола Netflow.
DCImanager — мультивендорная платформа автоматизации управления оборудованием (часть 2)

Интерфейс программного обеспечения DCImanager. Метрики сервера

Программное обеспечение DCImanager собирает статистику трафика для коммутатора. Данные для статистики собираются каждые пять минут.

Сбор данных производится по следующим параметрам:

  • объем трафика – общее количество переданной информации (учитывается входящий и исходящий трафик);
  • нагрузка на канал, объем данных, переданных по каналу связи в единицу времени. (учитывается входящий и исходящий трафик);
  • нагрузка на канал (Burstable), фактическое потребление пропускной способности на основе методики burstable (не учитывается 5 % максимальных измерений, собранных с интервалом в 5 минут, за выбранный период, учитывается входящий и исходящий трафик).

Отображается статистика за день, неделю, месяц, год или произвольный период. Доступен просмотр статистики по определенному порту и суммарных значений для всего устройства.

DCImanager — мультивендорная платформа автоматизации управления оборудованием (часть 2)

Интерфейс программного обеспечения DCImanager. Метрики коммутатора

DCImanager собирает статистику по источникам бесперебойного питания каждые пять минут. Сбор данных производится по следующим параметрам:

  • заряд батареи, мин (оставшееся время работы в автономном режиме);
  • нагрузка, %;
  • потребляемая мощность, кВт;
  • выходная мощность, кВт.
DCImanager — мультивендорная платформа автоматизации управления оборудованием (часть 2)

Интерфейс программного обеспечения DCImanager. Метрики источника бесперебойного питания

Мониторинг и передача оповещений

Возможности мониторинга и оповещения о событиях в программном обеспечении DCImanager реализованы на основе собственной службы сообщений, а также возможности интеграции с внешней системой мониторинга Zabbix.

Предоставляется возможность конфигурирования оправки оповещений о состоянии оборудования, управляемого платформой DCImanager администраторам платформы.

Оповещения и уведомления передаются:

  • во всплывающих окнах;

  • в таблице серверов в колонке «Статус»;

  • на адрес электронной почты администраторов.

В настройках уведомления задается период времени, после которого выход параметра за пределы диапазона считается критическим. Максимальные и минимальные допустимые значения параметров заданы в BMC сервера. Для создания и конфигурирования необходимых оповещений и уведомлений используется интерфейс центра уведомлений программного обеспечения DCImanager.

DCImanager — мультивендорная платформа автоматизации управления оборудованием (часть 2)

Интерфейс программного обеспечения DCImanager. Центр уведомлений

Дополнительно обеспечивается подключение к внешней системе мониторинга на основе программного обеспечения с открытым исходным кодом Zabbix. Используя Zabbix, можно настроить мониторинг сервера платформы и серверов-локаций. Для развертывания системы мониторинга Zabbix необходимо использовать отдельный физический или виртуальный сервер.

Основные компоненты Zabbix:

  • сервер компонент для управления сетевыми сервисами, хранения данных мониторинга, оповещения администратора о проблемах с оборудованием;
  • агент –  программное обеспечение, устанавливаемое на платформу и серверы-локации, агент собирает данные мониторинга и передает на сервер.

Преимущества платформы DCImanager

С точки зрения импортозамещения – платформа DCImanager полностью совместима с операционной системой Astra Linux и выступает альтернативой таким зарубежным продуктам, как EasyDCIM, SynergyCP (в области предоставления сервисов), HPE OneView, Lenovo XClarity, Dell OpenManage (в области управления оборудованием). 

Основные преимущества программного обеспечения DCImanager определяются его функциональными возможностями в различных аспектах комплексного управления оборудованием центров обработки данных. Удаленное управление физическими серверами в географически распределенных центрах обработки данных позволяет обеспечить снижение затрат на эксплуатацию оборудования и повышение эффективности его использования на основе:

  • автоматизированного и удаленного выполнения всех операций и задач жизненного цикла серверного оборудования;
  • постоянного мониторинга и контроля технического состояния серверного оборудования на физическом уровне с оперативным оповещением администраторов;
  • сокращения времени восстановления технической исправности и нормального функционирования серверного оборудования в нештатных ситуациях;
  • снижения трудозатрат администраторов, сокращения времени на обучение персонала, а также исключения необходимости привлечения специализированных экспертов.

Средства учета и инвентаризации активов информационной технологической инфраструктуры обеспечивают возможность объективного и достоверного контроля наличия и использования оборудования на основе:

  • простых и удобных форм инвентаризации для различных типов оборудования центров обработки данных;
  • автоматического обнаружения комплектующих в составе оборудования и корректного их внесения в инвентаризационные карточки (в том числе и при перемещении комплектующих);
  • ведения истории статусов и эксплуатации оборудования;
  • автоматизированного управления гарантийным и сервисным обслуживанием;
  • единого централизованного учета для всех центров обработки данных и предоставления сводных данных для планирования закупок оборудования.

Автоматизированное управление сетевым адресным пространством (IPAM) упрощает развертывание оборудования в сложной сетевой структуре для множества центров обработки данных за счет:

  • объединения физических сетей и IP-адреса в пулы;
  • поддержки управления адресным пространством IPv4/IPv6;
  • поддержки управления сетями VLAN;
  • инвентаризации IP-адресов и предотвращения различных ошибок использования адресов;
  • проверки IP-адреса на наличие в DNSBL, черном списке хостов (рассылка спама);
  • ведения истории операций в сети передачи данных.

Планирование разрешения оборудования, оптимизация использования инженерных систем центра обработки данных и монтажного пространства, а также рациональная утилизация ресурсов технических систем достигаются на основе:

  • визуализации карты размещения оборудования в центре обработки данных и монтажных стойках;
  • постоянного контроля энергопотребления на уровне монтажных стоек и отдельных экземпляров оборудования;
  • отображения состояния подключения оборудования и ошибок его работы (отказов);
  • формирования и отображения тепловой карты оборудования в центре обработки данных с отображением превышения норм и оповещением об аномалиях.

Постоянный мониторинг функционирования и технического состояния физического оборудования информационной инфраструктуры, включая физические серверы, сетевое оборудование, источники бесперебойного питания и блоки распределения электропитания. Отслеживаются все важные показатели оборудования, собирается статистика функционирования и необходимые метрики, а также предусмотрено оперативное оповещение администраторов об отказах оборудования, сбоях и отклонениях от нормальных параметров работы и состояния среды центра обработки данных.

Экосистема программного обеспечения и взаимосвязь продуктов ISPsystem

DCImanager — мультивендорная платформа автоматизации управления оборудованием (часть 2)

Внутренняя архитектура программного обеспечения DCImanager

Программное обеспечение DCImanager разработано на основе использования микросервисной архитектуры. Каждый сервис изолирован — его можно разрабатывать, развертывать и масштабировать независимо от других.

Изолированность позволяет использовать перспективные технологии и различные языки программирования (например, Python и Go). Микросервисы развертываются и функционируют с использованием среды контейнеризации Docker.

DCImanager — мультивендорная платформа автоматизации управления оборудованием (часть 2)

Первую часть статьи вы можете найти по ссылке.

Материал предоставлен директором технического центра Вигелем Антоновым.