-
Ключові слова:
багатовимірні дані, многомерные данные ; бази даних, БД, базы данных, databases, bases de donnees, bases de connaissances ; гешування, хеширование ; графи, графы, graphs ; кластеризація, кластеризация ; машинне навчання, машинное обучение ; обробка даних, обработка данных, data processing, Datenverarbeitung, traitement des donnees ; онлайнова реклама, онлайновая реклама ; пошукові системи, поисковые системы ; розпаралелювання, распараллеливание ; розподілені файлові системи, распределенные файловые системы ; соціальні мережі, социальные сети ; PageRank ; MapReduce ; Data Mining
-
Анотація:
Эта книга написана ведущими специалистами в области технолологий баз данных и веба. Благодаря популярности интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых нужно применять методы добычи данных (data mining). В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce - важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близостии потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя Page Rank, нахождение частых предметных наборов и кластеризация. Bo второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности. Издание будет в равной мере полезна студентам и программистам-практикам.
-
Теми документа
|