ИЗВЛИЧАНЕ НА ОГРОМНИ МАСИВИ ОТ ДАННИ
12.09.2023 |
Този курс започва с представяне на съвременните разпределени файлови системи и MapReduce, като се фокусира върху това, което отличава ефективните алгоритми MapReduce за обработка на големи масиви от данни. В останалата част на курса се разглеждат алгоритми за извличане на ценни модели и прозрения от тези огромни масиви от данни. Темите включват алгоритъма PageRank на Google за оценка на важността на уебстраници и различните му разширения, чувствително към локалността хеширане за идентифициране на подобни елементи в огромни масиви от данни и ефективни техники за намаляване на размерността на големи, редки матрици. В курса се разглеждат и редица други широкомащабни алгоритми, както е описано подробно в учебната програма.
Курсът е с продължителност 7 седмици. Преди да се включите в него, се препоръчва курс по системи за бази данни, както и основен курс по алгоритми и структури от данни.
Учебен план
Седмица 1:
– MapReduce
– Анализ на връзки – PageRank
Седмица 2:
– Хеширане, чувствително към локалност – Основи и приложения
– Мерки за разстояние
– Най-близки съседи
– Чести набори от елементи
Седмица 3:
– Извличане на данни от потоци
– Анализ на големи графи
Седмица 4:
– Системи за препоръки
– Намаляване на размерността
Седмица 5:
– Клъстеризация
– Компютърна реклама
Седмица 6:
– Поддържащи векторни машини
– Решаващи дървета
– Алгоритми за MapReduce
Седмица 7:
– Повече за анализ на връзки – PageRank, специфичен за тема, спам във връзки
– Повече за хеширане, чувствително към локалност
Допълнително информация ще откриете ТУК
Детайли
Уебсайт
Таргет аудитория
Дигитални умения за ИКТ професионалисти
Дигитална технология/ категория
Големи данни
Ниво на трудност
Средно
Формат на обучението
Онлайн
Такса за обучението
Безплатно обучение
Продължение на обучението
До три месеца
Тип на обучението
Курс
Език на обучението
Английски
Държава, предоставяща обучението
Други
Класификация
Единична възможност