Демо-доступ
Мы открываем демо-доступ к каждому курсу, чтобы вы не покупали кота в мешке. Оцените формат тренажера, глубину подачи материала и сразу получите прикладные навыки работы с инструментами.
Разбираем, как сырые данные превращаются в бизнес-ценность: ETL-процессы, OLTP/OLAP, batch и stream обработку.
Чему научитесь:
Знакомимся с Dagster и переходом от запуска задач к управлению активами данных: SDA, Resources, IOManagers и Asset Checks.
Чему научитесь:
Практикуемся с Software Defined Assets: создаем ассеты, настраиваем зависимости, метаданные и смотрим граф данных в UI.
Чему научитесь:
От теории ETL до production-деплоя Dagster: учимся проектировать пайплайны, работать с Software Defined Assets, ресурсами, партициями, расписаниями и интеграцией с dbt.
Теоретический фундамент инженерии данных: как сырая информация превращается в бизнес-ценность через ETL-процессы. Разбираем OLTP и OLAP, batch и stream обработку.
Чему вы научитесь:
Погружаемся в экосистему Dagster и переход от выполнения задач к управлению активами данных через Software Defined Assets. Разбираем декларативный подход, ресурсы и проверки качества.
Чему вы научитесь:
Практика работы с Software Defined Assets: пишем первый ассет, настраиваем зависимости, добавляем метаданные и смотрим граф данных в UI.
Чему вы научитесь:
Цель урока:
Научиться создавать собственные ресурсы для работы с внешними системами.
Практика на уроке:
Создадим подключение к внешнему API.
Цель урока:
Научиться создавать инструменты для сохранения и последующего использования данных из SDA.
Практика на уроке:
Создадим IOManager для записи сырых данных в PostgreSQL.
Цель урока:
Научиться разбивать SDA на более мелкие логические и физические части.
Практика на уроке:
Разделим данные по дате, напишем методы для ресурса и менеджера.
Цель урока:
Научиться создавать правила для автоматического получения и обработки данных.
Практика на уроке:
Напишем несколько расписаний и зададим правила для автоматической материализации ассета.
Цель урока:
Научиться управлять задачами, которые не связаны напрямую с данными.
Практика на уроке:
Создадим утилитарные задачи для запуска из UI, добавим алертинг и юнит-тесты.
Цель урока:
Запустить dbt-проект в Dagster.
Практика на уроке:
Познакомимся с подходами к интеграции, добавим расписание и настройку партиционирования.
Цель урока:
Запустить Dagster в Docker.
Практика на уроке:
Запустим все, что сделали ранее, отдельно, и подготовим к релизу в production.
Учимся собирать data flow: получать данные из внешних источников, обрабатывать, разделять, маршрутизировать и сохранять их в PostgreSQL.
Получите понимание, какие задачи может решать NiFi, а для каких лучше выбрать другой инструмент.
Цель урока:
Научиться создавать потоки NiFi, получать данные и выполнять простейшие операции обработки.
Практика на уроке:
Создадим подключение к внешнему API.
Цель урока:
Научиться обрабатывать структурированные данные и сохранять их в системы.
Практика на уроке:
Создадим поток для записи сырых данных в PostgreSQL.
Цель урока:
Разобраться со сложными механизмами обработки и управления данными.
Практика на уроке:
Будем делить данные, управлять обработкой и распределением данных в кластере.
Собираем практический стек DLT: ресурсы и источники, REST API, файловые источники, S3, интеграцию с Dagster и финальный пайплайн.