Молниеносный анализ данных в книге "Изучаем Spark"

Amellian

Member
FREEDOM
Joined
Jan 5, 2015
Messages
16,426
Reaction score
5,164
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. С помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala.
Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.

Книга поможет Вам:
Узнать, как развертывать интерактивные, пакетные и потоковые приложения;
Вы исследуете возможности использования разных источников данных, включая HDFS, Hive, JSON и S3;
Вы овладеете продвинутыми приемами программирования на основе Spark, такими как разделение данных на разделы и применение совместно используемых переменных.
и многое другое.

 
Top