Машины больших данных Скала^р МБД.8

Скала^р — разработчик и производитель модульной платформы для построения корпоративной ИТ-инфраструктуры. Компания выполняет роль технологического контрибьютора и объединяет в экосистему 25 партнеров – лидеров в своем классе решений.

Скала^р с 2015 года выпускает программно-аппаратные комплексы (Машины) и сегодня предлагает широкий технологический стек для решения задач виртуализации, создания транзакционных баз данных, хранения информации и аналитической обработки больших объемов данных. Продукты Скала^р включены в Реестр промышленной продукции, произведенной на территории Российской Федерации, и в Единый реестр российских программ для ЭВМ и БД.

Машины Скала^р являются серийно выпускаемыми преднастроенными комплексами, которые быстро развертываются и вводятся в эксплуатацию. Глубокая интеграция технических средств и программного обеспечения в ПАК Скала^р позволяет получить расширенные возможности и функциональность, которые недоступны при использовании компонентов по отдельности. Модульный принцип обеспечивает интеграцию разнородных компонентов ИТ-инфраструктуры в единую платформу предприятий, корпораций и ведомств. Единые поддержка и сервисное обслуживание для всех продуктов линейки Скала^р от производителя обеспечивают оперативное разрешение инцидентов на стыке технологий.

Продуктовые направления Скала^р:

Машины виртуализации Скала^р МВ на основе решений Basis для создания динамической конвергентной и гиперконвергентной инфраструктуры ЦОД и виртуальных рабочих мест пользователей.

Машины баз данных Скала^р МБД на основе решений Postgres Pro для замены Oracle Exadata в высоконагруженных системах с обеспечением высокой доступности и сохранности критически важных данных.

Машины больших данных Скала^р МБД.8 на основе решений Arenadata и Picodata для создания инфраструктуры хранения, преобразования, аналитической, статистической обработки данных с применением ИИ, а также распределенных вычислений.

Машины хранения данных Скала^р МХД на основе технологии объектного хранения S3 для геораспределенных катастрофоустойчивых систем с сотнями миллионов объектов различного типа и обеспечения быстрого доступа к ним.

Сайт: https://www.skala-r.ru/

Машины больших данных Скала^р МБД.8 для построения корпоративных хранилищ и витрин данных на базе продуктов Arenadata и Picodata

Скала^р МБД.Г (МБД8.АДБ)

Машина аналитической распределенной СУБД массово-параллельной обработки структурированных данных (на основе Greenplum)

Сценарии применения:

  • Классические корпоративные хранилища данных и системы отчетности: операционная, управленческая, обязательная регуляторная
  • Сверхбольшие хранилища данных с обновлением в реальном времени, обрабатывающие сложные аналитические запросы
  • Федерация данных с единым окном доступа
  • Работа систем маркетинговых кампаний и систем лояльности, cкоринг

Замещаемые технологии:

  • Аналитическая и гибридная типы нагрузки Oracle Exadata
  • Teradata

Состав Машины Скала^р МБД.Г

Блок вычисления и хранения

  • Хранение таблиц БД и их зеркальной реплики
  • Параллельное вычисление запросов

Блок коммутации и агрегации

  • Внутренний интерконнект на высокой скорости
  • Агрегация по схеме Leaf-Spine или «звезда»
  • Выделенная сеть для управления и мониторинга

Блок управления и распределения

  • Является основным интерфейсом для запросов и загрузки данных
  • Может быть расширен резервными узлами

Блок мониторинга и регистрации

  • Управление эксплуатацией и автоматизация критических процедур
  • Мониторинг состояния всех компонент Машины

Блок резервного копирования

  • Хранение резервных копий БД
  • Хранение настроек и метаданных
  • Пространство для ETL

Границы применимости

Ограничения для виртуальных сред для ПО Витрин данных: менее 70 запросов в секунду, до 2 ТБ хранимых данных

  • Виртуализация вносит дополнительные накладные расходы в операции с чтением-записью. Использование виртуализации для СУБД оправдано в случаях незначительного объема данных или малых нагрузках на БД при небольшом вводе-выводе
  • Наибольшей скоростью доступа после обращения к данным в оперативной памяти, обладают внутренние накопители
  • С ростом объема БД и интенсивности запросов растет эффективность вложений в Машины больших данных Скала^р МБД.Г, благодаря более высокой производительности Машины и отсутствию необходимости приобретения и эксплуатации дополнительных компонентов — СХД и ПО виртуализации

Скала^р МБД.Т (МБД8.АДГ)

Машина распределенных вычислений в оперативной памяти c применением технологии In-Memory Data Grid (на основе Tarantool)

Сценарии применения:

  • Системы сверхбыстрой отработки изменений и принятия решений в реальном времени
  • Буферизация и кэширование скоростной загрузки и выгрузки данных в аналитических хранилищах
  • Создание витрин данных со сверхвысокой отзывчивостью

Замещаемые технологии:

  • Oracle Exalogic и TimesTen
  • IBM (DB2 with BLU acceleration and dashdb)
  • Pivotal (Gemfire XD)
  • Teradata (intelligent memory)

Состав Машины больших данных Скала^р МБД.Т

  • Обработка таблиц БД в оперативной памяти
  • Репликация «горячих» данных
  • Хранение «холодных» таблиц БД
  • Параллельное вычисление запросов в каждом инстансе
  • Внутренний интерконнект на высокой скорости
  • Агрегация по схеме Leaf-Spine или «звезда»
  • Выделенная сеть для управления и мониторинга
  • Управление эксплуатацией и автоматизация критических процедур
  • Мониторинг состояния всех компонент Машины
  • Хранение резервных копий БД
  • Хранение настроек и метаданных
  • Пространство для ETL

Скала^р МБД.С (МБД8.АДС)

Масштабируемая и отказоустойчивая Машина потоковой обработки и очистки данных в реальном времени (на основе Kafka и NiFi)

Сценарии применения:

  • Потоковая обработка данных
  • Обработка данных и их транспортировка ETL
  • Обработка событий в реальном времени для служб мониторинга
  • Аналитика в реальном времени
  • Обработка потоков информации с множества конечных устройств IoT
  • Агрегация статистики из распределенных приложений для корпоративных витрин данных ETL
  • Интеграционная шина для приложений по модели издатель-подписчик

Замещаемые продукты и технологии:

  • Google Cloud Pub / Sub
  • Платформа MuleSoft Anypoint
  • Rabbit MQ
  • IBM MQ
  • Azure Event Hubs
  • Amazon Kinesis Data Streams

Состав Машины Скала^р МБД.С

Блок вычисления и хранения

  • Хранение таблиц БД и их синхронных и асинхронных реплик
  • Быстрое вычисление запросов

Блок коммутации и агрегации

  • Внутренний интерконнект на высокой скорости
  • Агрегация по схеме Leaf-Spine или «звезда»
  • Выделенная сеть для управления и мониторинга

Блок управления и распределения

  • Управление синхронизацией реплик БД
  • Поддержание отказоустойчивого кластера три узла для Zookeeper

Блок мониторинга и регистрации

  • Управление эксплуатацией и автоматизация критических процедур
  • Мониторинг состояния всех компонент Машины

Блок резервного копирования

  • Хранение резервных копий БД
  • Хранение настроек и метаданных
  • Пространство для ETL

Скала^р МБД.КХ (МБД8.АДКМ)

Машина быстрых аналитических витрин с реляционным доступом. Децентрализация, репликация, масштабируемость (на основе ClickHouse)

Сценарии применения:

  • Сверхбыстрые витрины данных с задаваемой глубиной выборки
  • Обработка событий в реальном времени для служб мониторинга, работы с чрезвычайными ситуациями
  • Аналитические изыскания, требующие скорости перебора гипотез
  • Работа систем маркетинговых кампаний и систем лояльности. Скоринг реакций и обработка метрик

Замещаемые продукты и технологии:

  • Vertica
  • Paraccel (Amazon RedShift)
  • Аналитическая нагрузка Oracle Exadata
  • Teradata
  • SAP HANA

Состав Машины Скала^р МБД.КХ

Блок вычисления и хранения

  • Хранение таблиц БД и их синхронных и асинхронных реплик
  • Быстрое вычисление запросов

Блок агрегации и коммутации

  • Внутренний интерконнект на высокой скорости
  • Агрегация по схеме Leaf-Spine или «звезда»
  • Выделенная сеть для управления и мониторинга

Блок управления и распределения

  • Управление синхронизацией реплик БД
  • Поддержание отказоустойчивого кластера три узла для Zookeeper

Блок мониторинга и регистрации

  • Управление эксплуатацией и автоматизация критических процедур
  • Мониторинг состояния всех компонент Машины

Блок резервного копирования

  • Хранение резервных копий БД
  • Хранение настроек и метаданных
  • Пространство для ETL

Скала^р МБД.Х (МБД8.АДХ)

Машина обработки данных средствами экосистемы Hadoop

Сценарии применения:

  • Разведочный, статистический, предсказательный анализ, машинное обучение и трансформация больших данных
  • Расширение возможностей существующих аналитических систем за счёт структурирования и унификации доступа к слабоструктурированным данным и практически неограниченного масштабирования по объёму обрабатываемых данных
  • Поиск и корреляций в данных в различных форматах: журналы серверов, потоки операций, данные интернета вещей

Замещаемые технологии:

  • Oracle BigData Appliance
  • Teradata Appliance for Hadoop
  • EMC DCA
  • Amazon Elastic MapReduce
  • Google Cloud DataProc

Состав Машины Скала^р МБД.Х

Блок вычисления и хранения

  • Хранение данных и реплик
  • Быстрое массово-паралельное выполнение запросов на узлах

Блок коммутации и агрегации

  • Внутренний интерконнект на высокой скорости
  • Агрегация по схеме Leaf-Spine или «звезда»
  • Выделенная сеть для управления и мониторинга

Блок управления и распределения

  • Управление синхронизацией реплик БД
  • Поддержание отказоустойчивого кластера три узла для Zookeeper

Блок мониторинга и регистрации

  • Управление эксплуатацией и автоматизация критических процедур
  • Мониторинг состояния всех компонент Машины

Блок резервного копирования

  • Хранение резервных копий БД
  • Хранение настроек и метаданных
  • Пространство для ETL