Курс по Data Warehouse Analytics Engineer на базе dbt для инженеров и аналитиков данных

Изучите один из самых востребованных инструментов аналитики, решая сложные практические задачи, научитесь DataOps-практикам, постройте хранилище данных на базе dbt, подготовьте и проанализируйте данные.
🔥 Старт 25 мая
Осталось 14 из 15 мест
3 месяца обучения
Стек, который вы освоите на курсе: dbt Core, dbt Cloud, SQL, Jinja, DuckDB,PostgreSQL, Dagster, Airflow
Проект получил сертификат качества
Партнер курса
сообщество dbt & modern data stack
Блок программы для Tilda

Демо-доступ

Бесплатная часть

Мы открываем демо-доступ к каждому курсу, чтобы вы не покупали кота в мешке. Оцените формат тренажера, глубину подачи материала и сразу получите прикладные навыки работы с инструментами.

1 Знакомимся с профессией Analytics Engineer

Роли в отделе аналитики и как сюда вписывается новая профессия. Какие старые боли аналитиков решает dbt.

Полученные навыки:

  • Понимание ролей и обязанностей в сфере аналитики и места в ней новой профессии Analytics Engineer.
  • Понимание, какие преимущества дает dbt и какие старые проблемы эффективно решает.
2 Ускоряем обучение с AI

Тренируемся эффективно использовать большие языковые модели, генерировать SQL-скрипты и дебажить ошибки dbt.

  • Осваиваем AI-помощника ДуДу.
  • Краткое введение в промпт-инжиниринг.
3 Создаем базу и проект dbt

Как получить доступ к dbt и чем отличается dbt Core от облака dbt Cloud. Создаем GitHub-репозиторий будущего проекта, поднимаем PostgreSQL и подключаем к новому проекту dbt.

Полученные навыки:

  • Понимание, чем отличаются разные виды хранилищ данных, какие у них достоинства, недостатки и границы применимости.
  • Умение настраивать локальную и облачную инфраструктуру для персональных проектов.
4 Начинаем освоение dbt на практике

Разбираем устройство проекта dbt, изучаем сущности и основные понятия. Учимся запускать dbt. Загружаем данные кикшеринга в базу и применяем первые трансформации.

Полученные навыки:

  • Понимание, как устроен проект dbt и описание моделей.
  • Умение создавать таблицы из SQL-моделей dbt.
+ ✨ Бонус

Мы знаем, как сложно вникать в архитектуру новых инструментов на английском. Поэтому мы перевели и адаптировали официальную документацию dbt на русский язык.

Получить доступ к доке
Блок преимуществ dbt для Tilda
Почему обучение
на базе dbt?

dbt — это один из ключевых инструментов современной аналитики и modern data stack. Он завоевал любовь аналитиков и дата-инженеров по всему миру.

Наша облачная LMS с встроенной IDE и поддержкой 50+ языков программирования доступна вам 24/7 с любого устройства. Интегрированный ИИ объяснянит материал, а тренажер с 100+ задачами и решениями помогает сразу закреплять знания без ожидания.
Решайте сложные задачи сразу в тренажере
Вас ждет закрытый чат с преподавателем и другими участниками курса, где можно смело задавать вопросы и быстро получать на них ответы.
Поддержка на всем пути обучения
Мы подготовили для вас бота с датасетами вашего бизнес-кейса, а также облачную инфраструктуру, чтобы обучение в симуляторе было максимально приближенным к реальности.
Инфраструктура, стенды и боты с подготовленными данными
Как проходит обучение?
Наш подход к обучению стирает границы между теорией и практикой, предлагая вам немедленное применение знаний в реальных условиях. Забудьте о скучных видеолекциях и бесконечном запоминании правил.

программа обучения на курсе Data Warehouse Analytics Engineer на базе dbt

Центральный блок программы для Tilda
Бесплатная часть программы
1 Знакомимся с профессией Analytics Engineer

Роли в отделе аналитики и как сюда вписывается новая профессия. Какие старые боли аналитиков решает dbt.

Полученные навыки:

  • Понимание ролей и обязанностей в сфере аналитики и места в ней новой профессии Analytics Engineer.
  • Понимание, какие преимущества дает dbt и какие старые проблемы эффективно решает.
2 Ускоряем обучение с AI

Тренируемся эффективно использовать большие языковые модели, генерировать SQL-скрипты и дебажить ошибки dbt.

  • Осваиваем AI-помощника ДуДу.
  • Краткое введение в промпт-инжиниринг.
3 Создаем базу и проект dbt

Как получить доступ к dbt и чем отличается dbt Core от облака dbt Cloud. Создаем GitHub-репозиторий будущего проекта, поднимаем PostgreSQL и подключаем к новому проекту dbt.

Полученные навыки:

  • Понимание, чем отличаются разные виды хранилищ данных, какие у них достоинства, недостатки и границы применимости.
  • Умение настраивать локальную и облачную инфраструктуру для персональных проектов.
4 Начинаем освоение dbt на практике

Разбираем устройство проекта dbt, изучаем сущности и основные понятия. Учимся запускать dbt. Загружаем данные кикшеринга в базу и применяем первые трансформации.

Полученные навыки:

  • Понимание, как устроен проект dbt и описание моделей.
  • Умение создавать таблицы из SQL-моделей dbt.
Продолжение программы Полная практика после демо-доступа
5 Деплоим таблицы и представления из dbt

Создаем таблицы и представления для анализа статистики поездок на самокатах. Реализуем граф зависимостей (DAG) между моделями, разбираем логи и ошибки.

Полученные навыки:

  • Понимание, как аналитики моделируют и перемоделируют хранилище данных.
  • Умение создавать модели dbt из SQL-запросов.
  • Расчет и визуализация географических данных.
6 Инкрементально обновляем большие таблицы

Учимся инкрементально обновлять большие таблицы на примере очистки и обогащения таблицы поездок. Стратегии инкрементальности в dbt. Пересчет таблиц и хитрости заполнения исторических данных.

Полученные навыки:

  • Понимание, когда нужно превращать обычные модели в инкрементальные и что для этого требуется.
  • Умение выбирать инкрементальную стратегию в зависимости от задачи и типа хранилища.
  • Базовое владение техникой шаблонизации SQL-моделей dbt с помощью встроенного инструмента Jinja.
  • Умение внедрять инкрементальность в SQL-код модели, проводить их отладку и заполнять исторические данные.
7 Создаем таблицы из CSV-файлов

Инджестинг данных на минималках: создаем таблицу с моделями самокатов из файла. Внедрение CSV-файлов с данными в проект dbt, особенности и ограничения.

Полученные навыки:

  • Понимание границ применения CSV-файлов в аналитике, их достоинств, недостатков, изучение альтернатив.
  • Умение создавать таблицы из CSV-файлов с помощью dbt seed.
  • Умение строить и обновлять пайплайны данных на основе CSV-файлов.
  • Умение генерировать CSV-файлы под заданные требования с помощью сервисов LLM.
8 Автоматизируем проект с помощью макросов

Оптимизируем SQL-код моделей посредством переиспользуемых текстовых макросов Jinja. Параметризация моделей с помощью переменных. Автоматизируем рутинные задачи типа выдачи доступов к таблицам.

Полученные навыки:

  • Умение создавать макросы Jinja для переиспользования бизнес-логики между моделями.
  • Умение создавать параметризованные модели, управляемые с помощью переменных из командной строки.
  • Умение правильно работать с тайм-зонами в хранилище.
  • Автоматизация проекта dbt для решения вспомогательных задач с помощью хуков.
  • Понимание основ низкоуровневой оптимизации данных в хранилище.
  • Настройка автоматической раздачи доступов к артефактам dbt.
9 Тестируем качество моделей

Введение в Data Quality. Учимся внедрять автотесты таблиц и колонок. Проверяем таблицу событий на отсутствие дублей и пропусков. Проверяем свежесть источников и пишем свои автотесты на SQL.

Полученные навыки:

  • Понимание основных проблем качества данных, умение диагностировать и решать их.
  • Использование взвешенного подхода при внедрении тестов данных с фокусом на основных проблемах.
  • Умение использовать стандартные тесты dbt для быстрого внедрения типовых проверок данных.
  • Умение создавать свои тесты данных на основе SQL для моделей и отдельных колонок.
10 Создаем каталог данных и внедряем контракты

Добавляем в проект метаданные и data contracts. Генерируем интерактивный портал с каталогом всего проекта и учимся работать с ним. Что такое артефакты dbt и как их можно использовать для анализа проекта.

Настраиваем CI/CD с GitHub Actions для автоматического обновления каталога данных из исходного кода.

11 Используем сторонние пакеты для решения сложных задач

Что такое пакеты dbt, какие возможности дают, где их брать и устанавливать. Обзор dbt Package Hub и наиболее интересных пакетов.

Переиспользование сложной бизнес-логики для быстрого построения моделей и создания тестов данных.

12 Настраиваем семантический слой для автоматической агрегации данных

Изучаем особенности семантического слоя, отличие от OLAP-кубов и разные способы его реализации. Создаем семантический слой в проекте dbt с MetricFlow.

13 Переносим легаси-код SQL в dbt

Переносим старый непонятный и недокументированный SQL-код из представлений и сохраненных процедур в проект dbt. Автоматизируем расчет показателей бизнеса с помощью dbt.

14 Используем dbt + DuckDB для быстрой обработки файлов

Что такое in-memory-аналитика и почему DuckDB набирает популярность. Заменяем расчеты в Excel на DuckDB и документированные SQL-модели. Выполняем финансовый анализ компании.

15 Деплоим проект в продакшн: CI/CD

Методы деплоя аналитических пайплайнов. Multi-stage окружение. Запускаем dbt-core в GitHub Actions по расписанию. Обзор оркестраторов для dbt.

Введение в Dagster и Airflow.

16 dbt и Dagster. От запуска до тестов (вебинар в записи)

На уроке научимся:

  • Запускать сборку моделей dbt руками.
  • Настраивать запуск по расписанию.
  • Работать с селекторами dbt.
  • Запускать тесты dbt assets.

Также коротко обсудим остальные аспекты работы с Dagster: software defined assets, ops, jobs.

17 dbt и Airflow (вебинар в записи)

На уроке научимся:

  • Запускать сборку моделей dbt руками.
  • Настраивать запуск по расписанию.
  • Работать с селекторами dbt.

Также обсудим отличия от Dagster и работу с дагами Airflow в целом.

Стоимость обучения
на курсе по DWH на dbt

🔥 Скидка до 14 700 рублей до 22 мая
Стоимость повысится через:
Дни
Часы
Минуты
Секунды
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
  • БОНУС доступы к 2 курсам:
+ Курс по ETL-разработке и оркестрации на Dagster и Apache Nifi
+ Тренажер DLT – Python ETL
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
99 700
85 900
Ниндзя данных
- 14 700 ₽ до повышения цен
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
55 000 ₽
49 900 ₽
Основательный подход
- 5 100 ₽ до повышения цен
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
  • БОНУС доступы к 2 курсам:
+ Курс по ETL-разработке и оркестрации на Dagster и Apache Nifi
+ Тренажер DLT – Python ETL
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
109 700
ПЕРСОНАЛЬНЫЙ МЕНЕДЖЕР
персональная скидка от 3-х студентов
Ниндзя данных
  • Бессрочный доступ к тренажеру и обновлениям
  • Домашние задания с мгновенной автопроверкой
  • ИИ-ментор ДуДу: CodeReview и подсказки 24/7
  • Доступ к комьюнити и чату с преподавателем
  • Проект в портфолио
  • Сертификат (RU / EN/ гособразца по запросу)
★ ЖИВОЕ СОПРОВОЖДЕНИЕ
Преподаватель отвечает лично в чате. Разбираем твой код и рабочие задачи.
АСИНХРОННЫЙ ФОРМАТ— учитесь в любое время
ПЕРСОНАЛЬНЫЙ МЕНЕДЖЕР
персональная скидка от 3-х студентов
60 500 ₽
Основательный подход
Можно получить налоговый вычет 13%

Мы обучили команды, которые строят современный IT-рынок

и еще в более 120 компаний
Хотите пройти обучение от компании? Напишите нам в поддержку
Вас ждет более 100 задач из разных бизнес-сфер, которые вы возьмете
в портфолио
Выстроить аналитический пайплайн из таблиц и представлений, который выдает общую и дневную статистику поездок с учетом данных пользователей. Покрыть его тестами качества данных и документацией.
Статистика поездок на самокатах
Разработать SQL-пайплайн, который будет инкрементально очищать и обрабатывать таблицу событий из мобильного приложения, обогащать ее данными поездок и пользователей и в конечном итоге представлять продуктовые метрики. Внедрить контракты данных, чтобы продуктовые аналитики знали, что ожидать на выходе.
Аналитика ивентов приложения
Помочь финансовым аналитикам обработать данные в Excel с помощью SQL, dbt и аналитической in-memory базы данных DuckDB, не передавая данные в сеть.
Анализ финансовых данных
Выступить в роли настоящего инженера аналитики и развернуть аналитические dbt-пайплайны с планировщиком, мониторингом и централизованным git-репозиторием для всей команды аналитиков. Внедрить проверку качества данных и веб-портал с каталогом данных и документацией.
Создание аналитической платформы
Что вы получите
после прохождения курса
Использование dbt и PostgreSQL, DuckDB
Практикуйтесь по моделированию данных
Постановка задач по разработке SQL-моделей и тестированию качества данных
Решение отдельной бизнес-задачи с помощью аналитики
Знания в создании ELT-пайплайнов
Основы и принципы, преимущества перед ETL
Оптимизация производительности, мониторинг, настройка CI/CD и разработка комплексных решений.
Навыки аналитики и визуализации данных и практики DevOPS
Навыки подготовки и тестирования данных
А также их качество (качество данных)
Опыт строительства хранилищ данных (DWH)
Понимание их специфики и подводных камней
Вы примерите на себя роль начинающего аналитика Марка в молодой компании кикшеринга. Вы только что ушли из банка, где вам не давали развиваться и пробовать современные подходы. Потому в новой компании вы будете изучать dbt и сразу внедрять его для решения реальных проблем, связанных с аналитикой поездок самокатов, событий пользователей, финансов и не только.
А что такое сюжетный симулятор?
И не все так просто, ведь задач полно, а старший аналитик Игорь все делает по-своему и отказывается помогать... Поэтому вам предстоит показать, на что вы способны, и убедить Игоря, что без dbt компания не сможет быстро расти дальше.
Справитесь?
Поможет вам в ваших начинаниях AI-помощник ДуДу, который прокачает ваши знания в области Big Data-аналитики и поможет решить проблемы по ходу курса.
Персонажи
  • Игорь Душнин
    Старший аналитик, ваш наставник, настоящая заноза
  • Марк (это вы)
    Молодой и перспективный аналитик
  • Фаря
    Руководитель отдела аналитики, которая в вас верит
  • Олег Петрович
    Бывший босс, от которого вы сбежали, любитель OLAP-кубов

Авторы курса

Павел Рословец
Principal Engineer в NXP Semiconductors
Co-founder INZHENERKA.TECH
Ex-Senior Data Engineer в Whoosh с более чем 15-летним опытом в IT, от стартапов до госкорпораций. Провел множество тренингов, обучив сотни разработчиков в Inzhenerka.tech
Дмитрий Володин
Занимается построением корпоративных хранилищ данных с 2019 года. Создавал платформы аналитики для издательской группы "Альпина", московской библиотеки им. Некрасова и digital-сегмента российского McDonald’s. С 2022 года на солнечном Кипре разрабатывает аналитические решения для одной из крупнейших рекламных сетей в мире.
Открытый урок по dbt в ИнженеркаТех
Обсудим, как dbt может упрощать ежедневные задачи аналитиков и инженеров.
Познакомимся с основными концепциями dbt и методами моделирования хранилищ данных.
Изучим создание каталога данных и управления data lineage для обеспечения прозрачности и отслеживаемости данных.
Ответим на любые вопросы участников и расскажем о нашем сюжетном симуляторе.
Мы поддерживаем сообщества инженеров и
аналитиков данных, помогая им развиваться
и обмениваться знаниями
Мы перевели документацию dbt на русский язык, и теперь она доступна бесплатно для всех ♥️
Ответы
на вопросы