Система распределенного хранения данных Р-Хранилище

27.12.2024

Директор технического центра компании Merlion Вигель Антонов рассказывает про продукт компании «Росплатформа».

Логотип Росплатформа
Вигель Антонов

Вигель Антонов

Гиперконвергентная инфраструктура (HCI) – комплексное программное решение, объединяющее и виртуализирующее вычислительные, сетевые и дисковые ресурсы хранения данных на основе унифицированной аппаратной серверной платформы.

Использование гиперконвергентной инфраструктуры, обусловленное потребностями ЦОДов в оптимизации их ресурсов и инженерных систем, вместе с виртуализацией стало одной из основных тенденций при строительстве технологической информационной инфраструктуры. Гиперконвергентная архитектура позволяет абстрагироваться от аппаратного уровня и перейти к уровню программно-определяемой информационной инфраструктуры. Сама ИТ-инфраструктура при этом приобретает высокую гибкость конфигурирования и расширенные возможности масштабирования для обеспечения эффективного функционирования «цифровых» сервисов, программных продуктов и систем.

Переход к гиперконвергенции позволяет достичь высокого уровня автоматизации основных процессов по ее конфигурированию, администрированию и поддержке, перейти к предоставлению инфраструктурных ресурсов по запросу на основе сервисной модели в оперативном режиме, а также упростить ее эксплуатацию и снизить затраты на ее сопровождение.

Среди современных промышленных программно-определяемых систем хранения данных для гиперконвергентных инфраструктур можно выделить следующие решения ведущих мировых производителей:

  • VMware Cloud Foundation & VMware vSphere Foundation - VMware vSAN
  • StarWind Virtual SAN
  • Nutanix Cloud Platform
  • HPE SimpliVity
  • SMTX OS Hyperconverged Compute and Storage
  • Dell VxRail
  • Scale Computing Platform
  • Sangfor HCI - Hyper Converged Infrastructure

Сегодня, когда вопросы импортозамещения решений вендоров, ушедших с российского рынка, встали особенно остро, программно-определяемая система хранения данных и объектного хранения «Р-Хранилище» от компании «Росплатформа» предлагает эффективное решение для построения современной ИТ-инфраструктуры.

Про функциональность продукта

«Р-Хранилище» – система программно-определяемого хранилища, которая разворачивается на физических серверах и объединяет внутренние дисковые системы этих серверов в единую распределенную СХД, с резервированием данных на основе их репликации между серверами.

Платформа «Р-Хранилище» позволяет:

  • формировать систему хранения данных на основе серверов без использования специализированных дисковых массивов;
  • использовать для построения систем хранения данных обычные серверы общепромышленного назначения;
  • обеспечивать высокую производительность системы хранения данных с возможностью ее горизонтального масштабирования;
  • предоставлять высокую надежность хранения и защиту от потери данных, при отказах отдельных дисков или серверов;
  • создавать гиперконвергентную инфраструктуру для платформ серверной виртуализации и контейнеризации приложений.

«Р-Хранилище» обладает рядом ключевых особенностей, определяющих его функциональность и эффективность применения:

  • объединение внутренних дисков серверов в единую распределенную систему хранения данных;
  • распределение и хранение данных в нескольких копиях на различных дисках, различных серверах или группах серверов;
  • многоуровневое хранение данных на различных типах дисков и кеширование операций ввода/вывода;
  • унифицированный файловый, блочный и объектный доступ к дисковым ресурсам;
  • реализация на основе открытого (свободного) технологического стека ПО.

«Р-Хранилище» реализует все корпоративные требования функциональности для современных программно-определяемых хранилищ данных:

  • централизованное управление с графическим интерфейсом администратора;
  • объединение в единое конфигурируемое хранилище данных локальных дисковых систем серверов с поддержкой разных типов носителей (SAS, SSD, NVMe);
  • обеспечение надежности и зашиты хранения данных как на основе репликации, так и с использованием избыточного кодирования (в том числе кода Рида-Соломона);
  • многоуровневое хранение данных с балансировкой и перераспределением «горячих» и «холодных» данных между тремя уровнями хранения;
  • применение топологии отказов с конфигурируемыми доменами отказов различного уровня;
  • журналирование операций записи на выделенных SSD дисках для снижения времени задержки операций записи;
  • сжатие дисков виртуальных серверов для оптимизации использования дискового пространства;
  • экспорт дискового пространства и предоставление доступа к дисковым ресурсам на основе протокола iSCSI;
  • функционал объектного хранилища с доступом на основе технологии и протокола API S3;
  • использование транзитной конфигурации дисков локальной дисковой системы JBOD, без необходимости применения технологии RAID;
  • агрегирование интерфейсов сетевых адаптеров для обеспечения отказоустойчивости и высокой производительности;
  • мониторинг функционирования, производительности и утилизации ресурсов хранилища данных;
  • проверка хранимых данных на долговечность, а их содержимого на читаемость и корректность, скраббинг данных (data scrubbing);
  • многопоточная обработка операций ввода/вывода в пространстве ядра по технологии fast path (экспериментальная функция).

Высокую производительность платформы «Р-Хранилище» обеспечивают собственные алгоритмы распределения данных и возможность использования SSD для кеширования операций чтения/записи или в качестве отдельного уровня хранения.

О преимуществах «Р-Хранилище»

«Р-Хранилище» может быть использовано в составе ИТ-инфраструктур различного масштаба. Преимущества, эффективность и рациональность применения платформы «Р-Хранилище» в современных корпоративных инфраструктурах определяются следующими факторами:

  • наличием развитого функционала обеспечения хранения и предоставления доступа к данным для широкого круга инфраструктурных и прикладных задач;
  • простота развертывания, конфигурирования и администрирования на основе централизованной системы управления;
  • интеграция в состав конвергентной вычислительной инфраструктуры для виртуализированных и конвейеризированных нагрузок;
  • сочетание технологий обеспечения сохранности данных и рационального использования дискового пространства;
  • высокая производительность и минимизация времени доступа к данным на основе технологий оптимизации операций ввода/вывода, а также, размещения, приоретизации и локализации данных;
  • горизонтальное масштабирование без потери производительности до хранилищ данных петабайтного уровня;
  • унифицированный доступ по различным протоколам для файловых и блочных клиентов;
  • возможность развертывания на стандартных серверных платформах без привязки к разработчикам и производителям оборудования;
  • совместная работа в единой экосистеме с платформой серверной виртуализации и контейнеризации приложений «Р-Виртуализация»;
  • предоставлением технической поддержки и оперативных обновлений со стороны российского разработчика (ПО включено в Единый реестр российских программ для электронных вычислительных машин и баз данных).

Архитектура платформы

Платформа «Р-Хранилище» объединяет локальные дисковые системы серверных платформ в распределенное хранилище данных с совместным пулом дисковых ресурсов, а также предоставляет возможности его конфигурации на логическом уровне. Это позволяет достичь высоких показателей отказоустойчивости и производительности при рациональном использовании обычных серверных платформ, обеспечивая при этом низкую стоимость дисковых ресурсов.

«Р-Хранилище» разворачивается в конфигурации кластера, который структурно состоит из компонент с назначенными им одной или несколькими ролями и соответствующими им службами.

Состав возможных и требуемых для кластера ролей включает в себя:

  • служба фрагментов (хранилище);
  • служба метаданных (метаданные);
  • сетевая служба точки доступа iSCSI;
  • сетевая служба шлюза S3 GW (точки доступа);
  • сетевая служба сервера имен NS S3;
  • сетевая служба сервера объектов OS S3;
  • сетевая служба панели управления;
  • сетевая служба SSH;
  • служба дополнительной роли SSD-кэш;
  • служба дополнительной роли системы.

Серверу в составе кластера можно определить сочетание ролей хранилища, метаданных и сети. Сервер кластера может быть одновременно точкой доступа S3, точкой доступа iSCSI и сервером хранилища.

На одном (только одном) сервере в кластере требуется разместить панель управления с веб-интерфейсом. При помощи панели управления администраторы могут управлять кластером платформы «Р-Хранилище».

Основная роль «хранилища» сервера кластера – размещение и хранение фрагментов данных. На данном сервере выполняется служба, которая размещает фрагменты данных определенного размера и предоставляет к ним доступ.

Все фрагменты данных реплицируются, реплики хранятся на разных серверах кластера с ролью «хранилища» для обеспечения постоянной доступности данных. При отказе одного сервера кластера, фрагменты данных, хранящиеся на нем, остаются доступны на остальных серверах кластера с ролью «хранилища».

Основная роль «метаданные» сервера кластера реализует функцию управления разделением данных на фрагменты, распределения их по серверам кластера с ролью «хранилище», а также отвечает за хранение информации в актуальном месте нахождения фрагментов данных. Роль «метаданные» обеспечивается установкой и работой на сервере кластера соответствующей службы.

Служба метаданных отвечает также за контроль наличия достаточного количества реплик фрагментов данных и ведения журнала всех событий кластера. Для обеспечения отказоустойчивости и постоянной доступности метаданных рекомендуется разворачивать в составе кластера не менее пяти служб метаданных. В этом случае кластер будет продолжать функционирование в полном объеме при отказе двух служб метаданных.

Сетевые роли отвечают за функцию точек доступа к хранилищу и обеспечивают возможность доступа к данным, хранимым кластером с использованием стандартных протоколов, включая iSCSI и S3. Для обеспечения постоянной роли точки доступа развертываются на нескольких серверах кластера.

Точка доступа iSCSI, позволяет использовать кластер платформы «Р-Хранилище» в качестве высокодоступного блочного хранилища для платформы виртуализации, систем управления базами данных и прикладных приложений. Точка доступа S3 дает возможность использовать платформы «Р-Хранилище» в качестве объектного хранилища данных, например, для систем резервного копирования, систем обмена электронными сообщениями и электронной почты, систем управления документами, а также для хранилища артефактов.

«Р-Хранилище», как объектное хранилище данных, предлагает для прикладных приложений API, совместимый с Amazon S3, а также поддерживает совместимость с S3-библиотеками для различных языков программирования, S3-браузерами и веб-браузерами.

Роли удаленного управления позволяют иметь доступ к пользовательскому веб-интерфейсу из сети общего пользования (роль панель управления) и подключаться к серверам кластера платформы «Р-Хранилище» посредством SSH (роль SSH).

Дополнительные роли кластера платформы «Р-Хранилище»:

  • роль «управление» представляет панель управления с веб-интерфейсом, позволяющую администраторам настраивать, управлять и осуществлять мониторинг кластеров «Р-Хранилище»;
  • роль «SSD-кэш», повышает производительность записи фрагментов путем создания кэша записей на выбранных твердотельных SSD накопителях;
  • роль «система», соответствует операционной системе сервера кластера, под которую выделяется отдельный диск, недоступный для хранения данных.

Кластер на основе платформы «Р-Хранилище» характеризуется следующими особенностями, требованиями к конфигурации и рекомендациями по своему составу:

  • минимальная конфигурация для продуктивных нагрузок должна включать в себя не менее пяти серверов и обеспечивать сохранность данных при отказе до двух серверов кластера;
  • производительность кластера связана с его горизонтальным масштабированием и растет в соответствии с увеличением количества серверов в сего составе, для промышленного применения рекомендуется
  • менее десяти серверов для достижения требуемой производительности, отказоустойчивости и объема хранения;

  • кластер может использовать разное оборудование для непромышленных применений, при продуктивных нагрузках необходимо использовать одинаковые серверные платформы в кластере;
  • кластер с продуктивными нагрузками не должен использовать серверные платформы с внешними дисками SAN/NAS, рекомендуется использование локальной дисковой системы;
  • кластер должен иметь не менее 20% свободного дискового пространства от общего объема для предотвращения дефрагментации данных и снижения производительности;
  • для обеспечения восстановления после отказов серверов в составе кластера требуется резерв дискового пространства для репликации в объеме не менее одного сервера хранения.

Кластер на основе платформы «Р-Хранилище» реализует защиту данных на уровне фрагментов данных благодаря избыточности. Копии каждого фрагмента данных хранятся на разных серверах хранилища, чтобы обеспечить доступность этих данных даже при недоступности некоторых серверов.

Кластер автоматически поддерживает необходимое число и актуальное состояние копий фрагментов данных. Если какой-либо сервер хранилища станет недоступен хранящиеся на нем копии замещаются новыми, которые распределяются среди доступных серверов. Если сервер хранилища станет доступен после простоя, устаревшие копии, хранящиеся на нем, обновляются.

Избыточность данных в кластере на основе платформы «Р-Хранилище» обеспечивается применением технологий репликации и избыточного кодирования. Репликация рекомендуется для рабочих нагрузок с большим количеством операций ввода/вывода, таких как виртуальные серверы с операционной системой Windows, высоконагруженных приложений, систем управления базами данных. Избыточное кодирование рекомендуется для рабочих нагрузок типа виртуальных серверов с операционной системой Linux с малой загрузкой или для хранения резервных копий данных, архивов и статических объектов.

Различные категории данных с точки зрения их использования и требуемого профиля доступа могут быть размещены с определенным распределением их фрагментов по разным серверам кластера с различными типами дисков. Например, данные требующие высокопроизводительного доступа с минимальными задержками могут быть размещены на твердотельных дисках SSD, а данные с архивным профилем доступа на дисках большого объема, оптимизированных для последовательного чтения.

Взаимодействие и обмен данными между серверами кластера «Р-Хранилище» происходит на основе использования сети передачи данных, которая образует внутренние и внешние связи кластера. Внутренняя сеть кластера, отвечает за взаимодействие и передачу данных межу узлами с назначенными им ролями. Сеть используется собственными службами и изолирована внутри кластера. Внешняя сеть отвечает за экспорт хранимых данных клиентам, предоставления им возможности подключения к точкам доступа кластера на серверах с соответствующим ролями.

Архитектура кластера платформы «Р-Хранилище»

Архитектура кластера платформы «Р-Хранилище»

Конфигурирование кластера «Р-Хранилище» требует назначения сетевым интерфейсам серверов в составе кластера определенных ролей (Управление, Хранилище, Object Storage, iSCSI, S3 и др.).

Внутренняя сеть платформы «Р-Хранилище» соединяет между собой все серверы в кластере. Она может использоваться для ролей управление, хранилище и Object Storage внутренний. Каждую из этих ролей можно переместить в отдельную выделенную внутреннюю сеть для обеспечения высокой производительности при высоких нагрузках.

Сеть ЦОД можно использовать для управления кластером и экспорта пространства хранилища по iSCSI другим серверам в ЦОД, то есть, для ролей управление и iSCSI.

Внешнюю сеть общего пользования можно использовать для экспорта пространства хранилища сторонним службам через точки доступа S3, то есть, для роли Object Storage внешняя.

«Р-Хранилище»: показания к применению

В качестве распределенного хранилища данных решение «Р-Хранилище» решает задачу создания комплексной гиперконвергентной инфраструктуры, образуя совместно с платформой «Р-Виртуализация» виртуальную среду для размещения инфраструктурных, платформенных и прикладных сервисов, которая не зависит от аппаратной реализации.

Платформа «Р-Хранилище» обеспечивает возможность эффективного применения в ИТ-инфраструктурах различного назначения, масштабируемых от системы управления малым предприятием, до глобальных информационных систем, а также Центров обработки данных для «облачных» и «цифровых» сервисов.

Продукт «Р-Хранилище» может быть использован для базового импортозамещения и создания импортонезависимой ИТ-инфраструктуры в любых областях и сферах деятельности.

Платформа «Р-Хранилище» доступна в Merlion. Форма для вопросов о платформе доступна по ссылке https://rus.merlion.ru/solutions/po/