Методы распределенной обработки больших объемов данных в Hadoop

Длительность
  • 6 занятий
  • 36 ак. часов
Получаемые навыки


— Вы получите общее представление о способах хранения и методах обработки больших объемов данных.
— Разберётесь в основах работы распределенных систем в контексте фреймворка Hadoop.
— Освоите практические навыки разработки приложений при использовании программной модели MapReduce.

Контроль знаний

На протяжении всего семестра вы будете получать баллы за выполнение определенных видов работ. Для успешного завершения курса необходимо набрать минимальное количество баллов, установленное преподавателями. Разбалловку и вес по курсу вы узнаете на первом занятии.

Требования

Вам понадобятся базовые знания любого языка программирования и компьютерных наук.

Цель курса — познакомить вас со стеком технологий Hadoop, применяемых для хранения, доступа и обработки больших объемов данных.

Современный мир IT-индустрии переживает революцию под названием «BigData»: доступность больших объемов данных открывает прекрасные возможости для использования в компьютерных приложениях и научных исследованиях. Такие вычисления требуют модели программирования, которая позволяла бы относительно легко распределять вычислительные задачи по большим компьютерных кластерам. И одной из них является модель MapReduce. Реализация MapReduce в открытом проекте Hadoop является наиболее популярной с точки зрения использования. Преимущества использования Hadoop включают в себя простоту применения для разработчиков, возможность масштабирования на объемы в петабайты данных и тысячи серверов, высокая степень отказоустойчивости. Hadoop является ключевым компонентом для стека технологий, которые обеспечивают работу приложений, ориентированных на интенсивную обработку больших объемов данных.

Смешанное занятие №1

Смешанное занятие №3

Смешанное занятие №4

Смешанное занятие №5

© VK, 2011–2022

Обратная связь

Присоединяйся:

Группа VK
  • Разработка:
    Команда
    VK Образование
Версия портала - 5.59.12