20773А. Анализ больших данных (Big Data) с помощью Microsoft R. Analyzing Big Data with Microsoft R
20773А. Анализ больших данных (Big Data) с помощью Microsoft R. Analyzing Big Data with Microsoft R
-
- Код курса:
- 20773А
-
- Длительность:
- 3 / 24
-
- Ближайшие даты:
-
-
- Цена, без НДС:
- Уточните
- Гаєвий Вадим МСТ
- З 2011 року тренер Microsoft - МСТ.
Викладає технології: Microsoft ASP.NET, Microsoft SQ...
Аудитория:
Этот курс предназначен для специалистов, анализирующих огромные наборы данных, а также разработчиков, использующих R в своих проектах.
Предварительная подготовка:
Обязательная предварительная подготовка:
- Успешное окончание курса Программирование на языке R. Уровень 1. Базовые знания или эквивалентная подготовка.
- Английский язык. Уровень 2. Elementary, часть 2, или эквивалентная подготовка.
- Успешное окончание курса Введение в статистику или эквивалентная подготовка.
- Успешное окончание курса Курс 20767А: Разработка и эксплуатация хранилищ данных на SQL Server 2016 или эквивалентная подготовка.
Приобретаемые навыки:
По окончании курса Вы сможете:
- описывать работу Microsoft R;
- использовать клиента R и Server R для обработки больших данных из разных хранилищ;
- визуализировать данные с помощью графиков и схем;
- преобразовывать и очищать наборы больших данных;
- использовать способы разделения аналитических задач на параллельные задачи;
- строить и оценивать регрессионные модели, генерируемые на основе больших данных;
- создавать, оценивать и разворачивать партиционированные модели на основе больших данных;
- использовать язык R в средах SQL Server и Hadoop.
Содержание курса:
Модуль 1. Сервер и клиент Microsoft R
- Обзор сервера Microsoft R
- Использование клиента Microsoft R
- Функции ScaleR
- Использование клиента R в VSTR и RStudio
- Обзор функций ScaleR
- Подключение к удалённому серверу
- Источники данных ScaleR
- Чтение данных в XDF-объекте
- Обобщение данных в XDF-объекте
- Чтение локального CSV-файла и передача данных в XDF-файл
- Преобразование данных на входе
- Чтение данных из SQL Server и передача в XDF-файл
- Подведение итогов в XDF-файле
- Визуализация данных в памяти
- Визуализации больших данных
- Использование ggplot для создания многогранной диаграммы с наложением
- Использование rxlinePlot и rxHistogram
- Преобразование больших данных
- Управление наборами данных
- Преобразование больших данных
- Сортировка и слияние больших данных
- Подключение к удаленному серверу
- Использование вычислительного контекста RxLocalParallel с функцией rxExec
- Использование пакета revoPemaR
- Использование rxExec для оптимизации использования ресурсов
- Создание и применение класса PEMA
- Кластеризации больших данных
- Создание регрессионных моделей и подготовка прогнозов
- Создание кластера
- Создание регрессионной модели
- Генерация данных для составления прогнозов
- Использование модели для составления прогнозов и сравнение результатов
- Создание партиционированных моделей на основе дерева решений.
- Тестирование прогнозов партиционированных моделей
- Разбиение набора данных
- Построение моделей
- Подготовка прогноза и тестирование результатов
- Сравнение результатов
- Использование R в SQL Server
- Использование Map/Reduce в Hadoop
- Использование Hadoop Spark
- Создание модели и прогнозирования результатов в SQL Server
- Анализ и вывод результата с помощью Map/Reduce в Hadoop
- Интеграция скрипта sparklyr в рабочий процесс ScaleR
Материалы и сертификаты:
Акцент Профи