SDP Hadoop

Продукт Platform V для обработки и хранения данных на базе экосистемы Hadoop
analitics.webp
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
Hadoop
Hadoop Distributed File System
Solr
Spark
SDP Hadoop — cобственная сборка фреймворка из компонентов экосистемы Apache Hadoop, которая позволяет гибко и безопасно решать задачи обработки, хранения и анализа больших объемов данных
Хранение структурированных и неструктурированных данных
Обработка данных с применением модели распределенных вычислений
Управление кластером компонентов, необходимых для работы с данными

Компоненты продукта

Ambari
Компонент для управления и контроля кластера Hadoop со стороны системных администраторов, а также его интеграции с корпоративной инфраструктурой
HBase
Нереляционная распределенная база данных на языке Java с открытым исходным кодом
HDFS
Распределенная файловая система c огромным объемом данных и легким доступом к ним
Hive
Инструмент инфраструктуры хранилища данных для обработки структурированных данных в Hadoop
Hadoop User Experience (HUE)
Веб-приложение с открытым исходным кодом для графического использования основных приложений Hadoop Ecosystem
MapReduce
Алгоритм преобразования наборов данных для децентрализованной обработки
Oozie
Проект с открытым исходным кодом на основе технологии Java. Упрощает создание потоков работ и координацию заданий
Solr
Платформа полнотекстового поиска с открытым исходным кодом, основанная на проекте Apache Lucence
Spark
Инструмент для молниеносных кластерных вычислений. Ускоряет работу программ в памяти в 100+ раз, а на диске — в 10+ раз
Sqoop
Инструмент для передачи данных между Hadoop и реляционными базами данных или мейнфреймами
Tez
Платформа на основе YARN для высокопроизводительной обработки данных в Hadoop
YARN
Компонент для связи блока хранения Hadoop с различными инструментами обработки. Облегчает MapReduce за счет управления ресурсами и планирования работ
ZooKeeper
Централизованная служба для поддержки информации о конфигурации, именования, обеспечения распределенной синхронизации и предоставления групповых служб

Преимущества

bolt-icon.svg
Собственная сборка Hadoop v3
gear-alt-icon.svg
Новейшие версии компонентов
shield-icon.svg
Доработки для ПРОМ по безопасности и надежности
flag-icon.svg
Готовность к нагрузкам уровня сервисов Сбера
message-square-dots-icon.svg
Русскоязычная поддержка

Пообщайтесь с экспертом

Оставьте запрос на консультацию — свяжемся с вами и ответим на вопросы

Документация

Продукты категории «Аналитика данных»