other

Инженер данных DWH в Путешествия

19 мая 2026

З/П не указана

Город: Москва

Яндекс

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

Обязанности:

Наша команда превращает терабайты данных в понятные и полезные инсайты, которые используют аналитики и сервис, помогающий миллионам людей путешествовать. Продукт растёт огромными темпами, и вместе с ним растут наши задачи — поэтому мы постоянно развиваем собственное DWH. Хранилище у нас построено на системах хранения данных YTsaurus (кластер MapReduce собственной разработки) и ClickHouse. Для разработки, оркестрации и мониторинга ETL-процессов используется собственный фреймворк, созданный внутри Яндекса. Для организации модели хранения данных на разных уровнях применяются различные методологии проектирования хранилищ данных: Lambda-архитектура, Data Lake, Data Vault. Какие задачи вас ждут Разработка, сопровождение и ревью ETL-процессов поставки данныхВам предстоит создавать конвейеры для извлечения, трансформации и загрузки данных из различных источников, настраивать их расписание и мониторинг. Важно регулярно проверять и улучшать код, быстро исправлять ошибки, а также тщательно документировать все преобразования и потоки данных — как собственные, так и коллег, обеспечивая соответствие стандартам качества и производительности. Проектирование структуры хранения данных в разных слоях хранилищаВы будете определять оптимальные схемы организации данных для каждого слоя, учитывая требования к скорости запросов и объёму хранения. Нужно разрабатывать модели данных, настраивать партиционирование, индексацию и сжатие для повышения производительности, а также согласовывать структуры с командами аналитики и разработки и адаптировать схемы, если бизнес-процессы меняются. Выявление и оптимизация неэффективных участков в процессах поставки данныхВы станете анализировать время выполнения ETL-задач, профилировать данные для обнаружения аномалий и избыточности, пересматривать алгоритмы трансформации для снижения нагрузки на систему. Погружение в данные прикладных бизнес-областей и становление в них экспертомВы будете детально изучать бизнес-процессы и ключевые метрики компании, разбираться в логике расчёта показателей и источниках их формирования. Мы ждем, что вы Проектировали DWH (слои, модели хранения данных, ETL-процессы) Разрабатывали ETL-процессы на Apache Airflow или аналогах Настраивали поставки данных по API Разбираетесь в SQL на уровне эксперта Пишете на одном из языков высокого уровня (Python, Go, Java и т. д.) Понимаете устройство и архитектуру реляционных баз данных Знаете основные алгоритмы и структуры данных, особенно используемые в работе с большими данными Будет плюсом, если вы Пользовались хотя бы одной MPP-СУБД (Greenplum, ClickHouse, Vertica, Teradata и т. д.) Понимаете принципы работы технологий распределённой обработки данных (Hadoop, MapReduce и MPP)

Показать контакты

Имя не указано

Пожаловаться ID: 154181027

Похожие вакансии

Инженер данных в команду DWH

Договорная

Москва

RWB (Wildberries & Russ)

Архитектор DWH (Инженер данных)

Договорная

Москва

Москвариум

Ведущий инженер данных DWH

Договорная

Москва

Eqvanta

Аналитик Данных DWH

От 250 000 руб.

Москва

Арканит

Архитектор данных (DWH)

Договорная

Москва

Группа страховых компаний Югория

Аналитик данных (DWH/BI)

Договорная

Москва

Деко Системс