Слушатели познакомятся с архитектурой Hadoop, концепцией MapReduce, YARN и HDFS, компонентами Hadoop: Hive, Flink, NiFi и HBase. Будут уметь работать с файлами в командной строке HDFS, с таблицами в Apache Hive, а также создавать пайплайн для обработки данных.
Длительность
16 часов
Уровень подготовки
Базовый
Формат
Гибридный курс
Целевая аудитория
Аналитики
Разработчики
Дата-инженеры, которым нужно работать с большими данными