-
Ключові слова:
аналіз даних, анализ данных, data analysis ; кластерні обчислення, кластерные вычисления ; машинне навчання, машинное обучение ; обробка даних, обработка данных, data processing, Datenverarbeitung, traitement des donnees ; програмування, программирование, programming, Programmieren, programmation ; фреймворки, фреймворки ; Resilient Distrsbuyed Datasets, RDD ; MLlib ; Apache Spark
-
Анотація:
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вьчиислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. С помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala. Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
-
Теми документа
-
УДК // Бази даних та їхні структури
-
УДК // Комп’ютерні мови
|