Обязанности:
Вам предстоит: Проектировать и развивать слои DWH/DLH, включая разработку концептуальной, логической и физической моделей данных и их адаптацию под платформы (GP, Iceberg, CH) с целью оптимизации и сокращения TTM Разрабатывать, внедрять и контролировать соблюдения стандартов моделирования, разработки и анализа данных, а также участвовать в формировании единых практик и политик управления данными (Data Governance) Проектировать и развивать пайплайны доставки данных (источники→ витрины) Определять и внедрять контроль качества данных (DQ) на всех слоях (raw, ods, core, dm), формализация и стандартизация проверок Организовывать и развивать способы работы с метаданными (техническими, бизнес, операционными), включая их сбор, хранение и интеграцию с бизнес-глоссарием Развивать платформу данных и автоматизацию Проектировать и внедрять ролевые модели доступа, участвовать в автоматизации управления доступами и проработке подходов к работе с чувствительными данными Работать с пользователями (согласовывать требования, согласовывать решения, презентовать решения, защищать решения) Будет плюсом: Развитие подходов DataOps / CI-CD Опыт работы с dbt Опыт работы с Apache Iceberg, ClickHouse Опыт проработки хранения и обработки чувствительных данных Опыт проектирования семантической модели данных Понимание DataOps и практик непрерывной доставки изменений в DWH Технологический стек: SQL (эксперт) Greenplum, Teradata, Vertica (экспертное знание физической модели, распределения, партиций, оптимизации запросов) S3, Kafka, Airflow, Git (опыт работы) Python, Java, C# (базовые знания одного из языков) Похожие вакансии
Договорная
Москва. Станции метро: Полянка, Третьяковская
Правительство Москвы
Договорная
Москва. Станции метро: Полянка, Третьяковская
Группа страховых компаний Югория