20773А. Анализ больших данных (Big Data) с помощью Microsoft R. Analyzing Big Data with Microsoft R

20773А. Анализ больших данных (Big Data) с помощью Microsoft R. Analyzing Big Data with Microsoft R
  • Код курса:
    20773А
  • Длительность:
    3 / 24
  • Ближайшие даты:

  • Цена, без НДС:
    Уточните
Гаєвий Вадим МСТ
З 2011 року тренер  Microsoft - МСТ.
Викладає технології: Microsoft ASP.NET, Microsoft SQ...
Аудитория:
Этот курс предназначен для специалистов, анализирующих огромные наборы данных, а также разработчиков, использующих R в своих проектах.
Предварительная подготовка:
Обязательная предварительная подготовка:
  • Успешное окончание курса Программирование на языке R. Уровень 1. Базовые знания или эквивалентная подготовка.
  • Английский язык. Уровень 2. Elementary, часть 2, или эквивалентная подготовка. 
Рекомендуемая подготовка:
  • Успешное окончание курса Введение в статистику или эквивалентная подготовка.
  • Успешное окончание курса Курс 20767А: Разработка и эксплуатация хранилищ данных на SQL Server 2016 или эквивалентная подготовка.
Приобретаемые навыки:
По окончании курса Вы сможете:
  • описывать работу Microsoft R;
  • использовать клиента R и Server R для обработки больших данных из разных хранилищ;
  • визуализировать данные с помощью графиков и схем;
  • преобразовывать и очищать наборы больших данных;
  • использовать способы разделения аналитических задач на параллельные задачи;
  • строить и оценивать регрессионные модели, генерируемые на основе больших данных;
  • создавать, оценивать и разворачивать партиционированные модели на основе больших данных;
  • использовать язык R в средах SQL Server и Hadoop.
Содержание курса:
Модуль 1. Сервер и клиент Microsoft R
  • Обзор сервера Microsoft R
  • Использование клиента Microsoft R
  • Функции ScaleR
Лабораторная работа: Обзор сервера и клиента Microsoft R
  • Использование клиента R в VSTR и RStudio
  • Обзор функций ScaleR
  • Подключение к удалённому серверу
Модуль 2. Обзор больших данных
  • Источники данных ScaleR
  • Чтение данных в XDF-объекте
  • Обобщение данных в XDF-объекте
Лабораторная работа: Обзор больших данных
  • Чтение локального CSV-файла и передача данных в XDF-файл
  • Преобразование данных на входе
  • Чтение данных из SQL Server и передача в XDF-файл
  • Подведение итогов в XDF-файле
Модуль 3. Визуализация больших данных
  • Визуализация данных в памяти
  • Визуализации больших данных
Лабораторная работа: Визуализация данных
  • Использование ggplot для создания многогранной диаграммы с наложением
  • Использование rxlinePlot и rxHistogram
Модуль 4. Обработка больших данных
  • Преобразование больших данных
  • Управление наборами данных
Лабораторная работа: Обработка больших данных
  • Преобразование больших данных
  • Сортировка и слияние больших данных
  • Подключение к удаленному серверу
Модуль 5. Распараллеливание операций анализа
  • Использование вычислительного контекста RxLocalParallel с функцией rxExec
  • Использование пакета revoPemaR
Лабораторная работа: Использование rxExec и revoPemaR для распараллеливания операций
  • Использование rxExec для оптимизации использования ресурсов
  • Создание и применение класса PEMA
Модуль 6. Создание и оценка регрессионной модели
  • Кластеризации больших данных
  • Создание регрессионных моделей и подготовка прогнозов
Лабораторная работа: Создание линейной регрессионной модели
  • Создание кластера
  • Создание регрессионной модели
  • Генерация данных для составления прогнозов
  • Использование модели для составления прогнозов и сравнение результатов
Модуль 7. Создание и оценка партиционированных моделей (Partitioning Model)
  • Создание партиционированных моделей на основе дерева решений.
  • Тестирование прогнозов партиционированных моделей
Лабораторная работа: Создание и оценка партиционированных моделей
  • Разбиение набора данных
  • Построение моделей
  • Подготовка прогноза и тестирование результатов
  • Сравнение результатов
Модуль 8. Обработка больших данных в SQL Server и Hadoop
  • Использование R в SQL Server
  • Использование Map/Reduce в Hadoop
  • Использование Hadoop Spark
Лабораторная работа: Обработка больших данных в SQL Server и Hadoop
  • Создание модели и прогнозирования результатов в SQL Server
  • Анализ и вывод результата с помощью Map/Reduce в Hadoop
  • Интеграция скрипта sparklyr в рабочий процесс ScaleR
Материалы и сертификаты:
Акцент Профи
Расписание курсов на 6 месяцев

Возврат к списку



программа курса Microsoft10990
Программа и регистрация на курс Система управления бизнес-проектами, квалификация "Project management" (IAPBE) в акцент профи
Microsoft Office Excel 2 дні поглиблене навчання


Перейти на программу курса ефективні презентації вражаючи презентації power point
Зарегистрироваться на Курс 10961 Автоматизация администрирования с Windows PowerShell