Курс по ETL-разработке и оркестрации на Dagster и Apache Nifi, DLT

Научитесь строить надежные ETL-пайплайны на базе Dagster и Apache NiFi, применяя Software Defined Assets и кастомные IOManager для сбора и записи данных в PostgreSQL. Вы освоите автоматизацию обработки информации через внешние API и развертывание оркестратора в контейнерах Docker.
DAGSTER
🔥 Старт 25 мая
Осталось 9 из 15 мест
3 месяца обучения
Стек, который вы освоите на курсе: Dagster, SDA (Software Defined Asset), IOManager, dbt, Docker, PostgreSQL, API Integration, NiFi, DLT
Партнер курса
сообщество dbt & modern data stack
Блок демо-доступа для Tilda

Демо-доступ

Бесплатная часть

Мы открываем демо-доступ к каждому курсу, чтобы вы не покупали кота в мешке. Оцените формат тренажера, глубину подачи материала и сразу получите прикладные навыки работы с инструментами.

1 Теория ETL

Разбираем, как сырые данные превращаются в бизнес-ценность: ETL-процессы, OLTP/OLAP, batch и stream обработку.

Чему научитесь:

  • Выбирать ETL, ELT или EtLT под требования бизнеса.
  • Извлекать и нормализовать данные на Python.
  • Готовить первый пайплайн к загрузке в аналитическое хранилище.
2 Введение в Dagster

Знакомимся с Dagster и переходом от запуска задач к управлению активами данных: SDA, Resources, IOManagers и Asset Checks.

Чему научитесь:

  • Проектировать устойчивые пайплайны данных.
  • Разделять бизнес-логику и инфраструктуру через Resources и IOManagers.
  • Запускать локальный проект Dagster и настраивать проверки качества.
3 SDA в Dagster

Практикуемся с Software Defined Assets: создаем ассеты, настраиваем зависимости, метаданные и смотрим граф данных в UI.

Чему научитесь:

  • Проектировать связанные цепочки ассетов.
  • Управлять контекстом выполнения и логированием.
  • Внедрять Asset Checks, чтобы останавливать обработку при ошибках.
Почему на базе Dagster и NiFi?
Dagster – ключевой инструмент Modern Data Stack. Он дает инженерам гибкость и контроль, недоступные в старых решениях, позволяя строить сложные и надежные пайплайны.
Наш тренажер дает фундаментальные знания. Вы поймете принципы построения пайплайнов, поэтому после курса сможете работать с любым оркестратором — будь то Dagster, Airflow или Prefect.
Хотите освоить ETL-разработку и оркестрацию?
  • Asset-based подход. Смещает фокус с простого выполнения задач на управление качеством и актуальностью самих данных (Software Defined Assets).
  • Observability. Делает процессы прозрачными за счет автоматического сбора богатых метаданных.
  • Data Lineage. Визуализирует весь путь данных — от сырого источника до финального отчета, упрощая отладку.
  • Гибкая интеграция. Позволяет объединить разрозненные инструменты и подсистемы в единый управляемый процесс.
Dagster завоевал любовь, потому что он
Знание ETL-разработки и оркестрации – это must have для уровня middle/senior-аналитика и инженера как на российском, так и на международном рынке

Почему стоит освоить?

Наша облачная LMS с встроенной IDE и поддержкой 50+ языков программирования доступна вам 24/7 с любого устройства. Интегрированный ИИ объяснянит материал, а тренажер с 100+ задачами и решениями помогает сразу закреплять знания без ожидания.
Решайте сложные задачи сразу в тренажере
Вас ждет закрытый чат и другими участниками курса, где можно смело задавать вопросы и быстро получать на них ответы.
Поддержка на всем пути обучения
Мы подготовили для вас бота с датасетами вашего бизнес-кейса, а также облачную инфраструктуру, чтобы обучение в симуляторе было максимально приближенным к реальности.
Инфраструктура, стенды и боты с подготовленными данными
Как проходит обучение?
Наш подход к обучению стирает границы между теорией и практикой, предлагая вам немедленное применение знаний в реальных условиях. Забудьте о скучных видеолекциях и бесконечном запоминании правил.
Вас ждет более 60 задач из разных бизнес-сфер, которые вы возьмете
в портфолио
Начнем получать сырые данные из источника в проекте.
Создадим подключение к внешнему API.
Создадим IOManager для записи сырых данных в PostgreSQL.
Партиционируем по дате ассет, напишем для этого методы в ресурсе и менеджере.
Напишем несколько расписаний и зададим правило для автоматической материализации ассета.
Создадим утилитарные задачи, которые сможем запускать из UI, а также добавим алертинг и юнит-тесты.
Познакомимся с двумя разными подходами к интеграции, добавим расписание и партиционирование.
Запустим все, что сделали раньше, в Docker.
Дмитрий Володин
TrafficStars
Занимается построением корпоративных хранилищ данных с 2019 года. Создавал платформы аналитики для издательской группы «Альпина», московской библиотеки им. Некрасова и digital-сегмента российского McDonald’s. С 2022 года на солнечном Кипре разрабатывает аналитические решения для одной из крупнейших рекламных сетей в мире – TrafficStars.
Бронислав Житников
Состоит в программном комитете SmartData
Работает в IT более 17 лет и около 15 лет занимается разработкой. Последние 2 года развивает проект загрузки сырых данных в компании как архитектор и владелец продукта. Имеет опыт запуска продукта на основе Apache NIFI для крупного Enterprise. Является администратором и активным участником сообщества пользователей NiFi в России.
Positive Technologies, ex Т-Банк
Иван Матвеев
Иван Матвеев
Я Data Engineer с опытом построения data-платформ и ETL/ELT пайплайнов. Пишу о современных инструментах обработки данных, лучших практиках Data Engineering, построении дата-платформ и data quality. Делюсь опытом работы с Dagster, DBT, DLT, Trino и другими инструментами из экосистемы больших данных

Авторы тренажера

программа

Программа ETL-курса для Tilda
Модуль 1
Dagster
ETL, оркестрация и активы данных

От теории ETL до production-деплоя Dagster: учимся проектировать пайплайны, работать с Software Defined Assets, ресурсами, партициями, расписаниями и интеграцией с dbt.

0 Теория ETL — доступно в бесплатной части

Теоретический фундамент инженерии данных: как сырая информация превращается в бизнес-ценность через ETL-процессы. Разбираем OLTP и OLAP, batch и stream обработку.

Чему вы научитесь:

  • Выбирать ETL, ELT или EtLT под требования бизнеса к скорости и качеству данных.
  • Извлекать и нормализовать данные на Python.
  • Готовить первый пайплайн к загрузке в аналитическое хранилище.
1 Введение в Dagster — доступно в бесплатной части

Погружаемся в экосистему Dagster и переход от выполнения задач к управлению активами данных через Software Defined Assets. Разбираем декларативный подход, ресурсы и проверки качества.

Чему вы научитесь:

  • Проектировать устойчивые пайплайны данных.
  • Разделять бизнес-логику и инфраструктуру через IOManagers и Resources.
  • Запускать локальный проект Dagster и настраивать Asset Checks.
2 SDA в Dagster — доступно в бесплатной части

Практика работы с Software Defined Assets: пишем первый ассет, настраиваем зависимости, добавляем метаданные и смотрим граф данных в UI.

Чему вы научитесь:

  • Проектировать связанные цепочки ассетов.
  • Управлять контекстом выполнения и логированием.
  • Внедрять Asset Checks, которые блокируют обработку данных при ошибках.
3 Configurable Resource

Цель урока:

Научиться создавать собственные ресурсы для работы с внешними системами.

Практика на уроке:

Создадим подключение к внешнему API.

4 IOManager

Цель урока:

Научиться создавать инструменты для сохранения и последующего использования данных из SDA.

Практика на уроке:

Создадим IOManager для записи сырых данных в PostgreSQL.

5 Partitions

Цель урока:

Научиться разбивать SDA на более мелкие логические и физические части.

Практика на уроке:

Разделим данные по дате, напишем методы для ресурса и менеджера.

6 Автоматизация

Цель урока:

Научиться создавать правила для автоматического получения и обработки данных.

Практика на уроке:

Напишем несколько расписаний и зададим правила для автоматической материализации ассета.

7 Ops, Jobs, Hooks

Цель урока:

Научиться управлять задачами, которые не связаны напрямую с данными.

Практика на уроке:

Создадим утилитарные задачи для запуска из UI, добавим алертинг и юнит-тесты.

8 Интеграция с dbt

Цель урока:

Запустить dbt-проект в Dagster.

Практика на уроке:

Познакомимся с подходами к интеграции, добавим расписание и настройку партиционирования.

9 Деплой

Цель урока:

Запустить Dagster в Docker.

Практика на уроке:

Запустим все, что сделали ранее, отдельно, и подготовим к релизу в production.

Модуль 2
NiFi
Потоки данных и визуальная обработка

Учимся собирать data flow: получать данные из внешних источников, обрабатывать, разделять, маршрутизировать и сохранять их в PostgreSQL.

10 Введение в NiFi

Получите понимание, какие задачи может решать NiFi, а для каких лучше выбрать другой инструмент.

11 Получение и обработка данных

Цель урока:

Научиться создавать потоки NiFi, получать данные и выполнять простейшие операции обработки.

Практика на уроке:

Создадим подключение к внешнему API.

12 Сохранение данных

Цель урока:

Научиться обрабатывать структурированные данные и сохранять их в системы.

Практика на уроке:

Создадим поток для записи сырых данных в PostgreSQL.

13 Сложная обработка

Цель урока:

Разобраться со сложными механизмами обработки и управления данными.

Практика на уроке:

Будем делить данные, управлять обработкой и распределением данных в кластере.

Модуль 3
DLT
Пайплайны, API, файлы и end-to-end проект

Собираем практический стек DLT: ресурсы и источники, REST API, файловые источники, S3, интеграцию с Dagster и финальный пайплайн.

14 Знакомство с DLT и создание первого пайплайна
  • Установка DLT и настройка рабочего окружения.
  • Работа с демонстрационными данными о шахматных партиях.
  • Загрузка данных в DuckDB и анализ через SQL-клиент.
15 Ресурсы и источники данных в DLT
  • Понятия @dlt.resource и @dlt.source, их назначение и различия.
  • Создание ресурсов для работы с CSV-файлами.
  • Подключение к ClickHouse как источнику данных.
16 Работа с REST API и конфигурацией
  • Подключение к GitHub API для получения issues и данных о контрибьюторах.
  • Использование встроенного источника rest_api_source.
  • Настройка пагинации для обработки больших объемов данных.
17 Загрузка файлов из различных источников
  • Работа с локальными и облачными файлами.
  • Обработка Parquet-файлов на примере данных о поездках самокатов.
  • Подключение и загрузка данных из Amazon S3.
  • Анализ загруженных данных: подсчет записей в таблице events.
18 Интеграция с Dagster
  • Создание проекта Dagster с помощью scaffold.
  • Работа с @dlt_assets для управления активами данных.
  • Кастомизация пайплайнов через DagsterDltTranslator.
  • Безопасное хранение токенов и конфигурации через .env файлы.
19 Практический проект: end-to-end пайплайн
  • Создание единого пайплайна с интеграцией API, ClickHouse и файловых источников.
  • Настройка ассетов и мониторинг через интерфейс Dagster.
  • Валидация результатов: консолидация всех данных в едином хранилище.

Стоимость курса
по оркестрации данных на Dagster и DLT

🔥 Скидка до 14 700 рублей до 22 мая
Стоимость повысится через:
Дни
Часы
Минуты
Секунды
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
  • БОНУС доступы к 2 курсам:
+ Курс по Data Warehouse Analytics Engineer на базе dbt
+ Тренажер DLT – Python ETL
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
99 700
85 900
Ниндзя данных
- 14 700 ₽ до повышения цен
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
49 900 ₽
39 900 ₽
Основательный подход
- 5 100 ₽ до повышения цен
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
  • БОНУС доступы к 2 курсам:
+ Курс по Data Warehouse Analytics Engineer на базе dbt
+ Тренажер DLT – Python ETL
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
109 700
ПЕРСОНАЛЬНЫЙ МЕНЕДЖЕР
персональная скидка от 3-х студентов
Ниндзя данных
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
ПЕРСОНАЛЬНЫЙ МЕНЕДЖЕР
персональная скидка от 3-х студентов
54 900 ₽
Основательный подход
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
  • БОНУС доступы к 2 курсам:
+ Курс по Data Warehouse Analytics Engineer на базе dbt
+ Тренажер DLT – Python ETL
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
99 700
Ниндзя данных
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
49 900 ₽
Основательный подход
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
  • БОНУС доступы к 2 курсам:
+ Курс по Data Warehouse Analytics Engineer на базе dbt
+ Тренажер DLT – Python ETL
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
109 700
ПЕРСОНАЛЬНЫЙ МЕНЕДЖЕР
персональная скидка от 3-х студентов
Ниндзя данных
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
ПЕРСОНАЛЬНЫЙ МЕНЕДЖЕР
персональная скидка от 3-х студентов
54 900 ₽
Основательный подход

Мы обучили команды, которые строят современный IT-рынок

и еще в более 120 компаний
Остались вопросы или хотите пройти обучение от компании? Напишите нам в поддержку
Открытый урок по NiFi в ИнженеркаТех
Что такое Apache NiFi и где он реально полезен?

На уроке:
  • Поймёте, что такое NiFi и где он незаменим
  • Разберём, для каких задач он подходит, а когда лучше выбрать другой инструмент
  • Познакомитесь с возможностями и архитектурой без перегруза
Присоединяйтесь к довольным выпускникам и нашему сообществу в телеграм
Ответы
на вопросы