• Форумы
  • Складчикам курсы
  • Администрирование

[karpov.courses] Инженер данных. Часть 2 из 5 (Евгений Ермаков, Валерий Соколов)

Найти складчину
  • Дата начала 16.10.2022
Организатор: ЫЫыыыЫЫ
Ссылки для скачивания
Скачать
Скачать
Скачать
ЫЫыыыЫЫ
Организатор
Сообщения
Монеты
0.0
Оплачено
0
Купоны
0
Кешбэк
0
Баллы
0
16.10.2022
  • @Skladchiki
  • #1

Складчина: [karpov.courses] Инженер данных. Часть 2 из 5 (Евгений Ермаков, Валерий Соколов)

Ссылка на картинку
НАУЧИТЕСЬ ПРАВИЛЬНО ГОТОВИТЬ ДАННЫЕ ЛЮБЫХ РАЗМЕРОВ И СЛОЖНОСТИ
Обучающие выборки для машинного обучения и красивые графики для отчётов не появляются сами собой: данные нужно собирать, хранить, валидировать и комбинировать между собой, быстро реагируя на изменения в их структуре.


ДЛЯ КОГО ЭТОТ КУРС:
ИНЖЕНЕР ДАННЫХ
Уже работаете с хранилищами данных, но хотите систематизировать знания и глубже погрузиться в актуальные технологии.

АНАЛИТИК ДАННЫХ
Постоянно взаимодействуете с базами данных, но хотите лучше разобраться в ETL-процессах и выйти на качественно новый уровень в аналитике.

BI-РАЗРАБОТЧИК
Занимаетесь развитием систем бизнес-аналитики, хотите освоить архитектуру современных хранилищ данных и научиться их проектировать.

BACKEND-РАЗРАБОТЧИК
Имеете опыт бэкенд-разработки и хотите применить его для решения задач, связанных с хранением и обработкой больших данных.

ПОДРОБНЕЕ О КУРСЕ
Преподаватели расскажут о курсе и его содержании. Вы узнаете, в чём ценность каждого модуля и как полученные знания помогут в дальнейшей работе.

РАБОТАЙТЕ С ДАННЫМИ В ЛЮБЫХ СИСТЕМАХ
— Изучайте архитектуру хранилищ данных и подходы к их проектированию
— Сравнивайте на практике Big Data решения на базе Hadoop и реляционные MPP СУБД
— Учитесь работать с облаками и автоматизировать ETL-процессы с помощью Airflow

ПРОГРАММА КУРСА

1. РЕЛЯЦИОННЫЕ И MPP СУБД
Начнём погружение в инженерию данных со знакомства с реляционными и MPP базами данных. Рассмотрим их архитектуру, обсудим популярные решения и узнаем, в каких случаях MPP СУБД оказываются лучше традиционных. Научимся готовить PostgreSQL и MPP базы данных на примере Greenplum.

2. АВТОМАТИЗАЦИЯ ETL-ПРОЦЕССОВ
ETL — ключевой процесс в управлении хранилищами данных. Рассмотрим принципы и основные этапы его построения. Познакомимся с популярным инструментом Airflow, подробно разберём его основные компоненты и научимся с его помощью автоматизировать ETL-пайплайны.

3. BIG DATA
Познакомимся с механизмами распределённого хранения больших данных на базе Hadoop, разберём основные паттерны реализации их распределённой обработки. Рассмотрим вопросы отказоустойчивости и восстановления после сбоев. Поговорим о потоковой обработке данных, методах и средствах мониторинга и профилирования заданий Spark.

4. ПРОЕКТИРОВАНИЕ DWH
Data Warehouse — централизованное хранилище данных из разных источников. Познакомимся с его верхнеуровневой логической архитектурой, рассмотрим её основные компоненты и разберём на практике разные подходы к проектированию детального слоя DWH.

5. ОБЛАЧНОЕ ХРАНИЛИЩЕ
Рассмотрим облачные решения и инструменты для построения DWH и Data Lake. Познакомимся с Kubernetes и научимся применять его для работы с данными. Поработаем с облаком на практике, рассмотрим процесс установки и настройки JupyterHub и Spark в Kubernetes.

6. ВИЗУАЛИЗАЦИЯ ДАННЫХ
Рассмотрим основные принципы работы с данными с точки зрения их визуализации и научимся смотреть на данные глазами их потребителя. Познакомимся с Tableau — гибким и мощным BI-инструментом. Узнаем, как он взаимодействует с базами данных, и построим с его помощью интерактивный дашборд для мониторинга DWH платформы.

7. BIG ML
Познакомимся с теорией распределённого машинного обучения. Научимся работать с популярным модулем Spark ML и рассмотрим подходы к обучению и применению моделей на больших данных.

8. УПРАВЛЕНИЕ МОДЕЛЯМИ
В работе инженеры часто сталкиваются с подготовкой данных для обучения ML-моделей. Рассмотрим инструменты для построения ML-пайплайнов, версионирования датасетов, организации учёта и трекинга моделей.

9. УПРАВЛЕНИЕ ДАННЫМИ
На практике часто приходится иметь дело с разными данными и огромным числом интеграций и процессов, выполняющих над ними те или иные преобразования. Познакомимся с популярными подходами к управлению данными, обсудим инструменты для контроля качества данных и отслеживания их происхождения.
Показать больше
 
Зарегистрируйтесь , чтобы посмотреть авторский контент.
Поиск по тегу:
Теги
karpov.courses валерий соколов евгений ермаков инженер данных часть 2 из 5
Похожие темы
Скачать [Karpov.Courses] Инженер данных. Часть 3 из 5 (Евгений Ермаков, Валерий Соколов)
  • 03.12.2022
Просмотры
1K
25.01.2023
Скачать [karpov.courses] Инженер данных. Часть 5 из 5 (Евгений Ермаков, Дина Сафина, Антон Пилипенко, Валерий Соколов)
  • 15.02.2023
Просмотры
1K
15.02.2023
Скачать [karpov.courses] Инженер данных. Часть 1 из 5 (Евгений Ермаков, Дина Сафина, Антон Пилипенко, Валерий Соколов)
  • 06.09.2022
Просмотры
1K
06.09.2022
Скачать [Karpov.Courses] Инженер данных. Часть 4 из 5 (Евгений Ермаков, Дина Сафина, Антон Пилипенко, Валерий Соколов)
  • 22.01.2023
Просмотры
1K
22.01.2023
Скачать [Karpov.Courses] Инженер данных. Все части (Евгений Ермаков, Валерий Соколов)
  • 22.09.2023
Просмотры
2K
22.09.2023
Показать больше похожих складчин
anacondaz
👤 Персонаж 👤
Складчик
Сообщения
Монеты
+151.0
Оплачено
3 796
Купоны
0
Кешбэк
0
Баллы
0
04.12.2022
  • #2
 
Комментарий

Зарегистрируйтесь или войдите, чтобы обсуждать и скачивать материалы!

Зарегистрироваться

Создайте учетную запись. Это быстро!

Регистрация

Авторизоваться

Вы уже зарегистрированы? Войдите.

Вход
  • Форумы
  • Складчикам курсы
  • Администрирование
  • Русский (RU)
  • Условия и правила
  • Политика конфиденциальности
  • Помощь
Меню
Вход

Регистрация

  • Форумы
    • Новые сообщения
    • Поиск сообщений
  • Что нового?
    • Новые сообщения
    • Новые сообщения профилей
    • Последняя активность
    • Новые оценки тем
  • Помощь