В трайбе SberWorks (Сбер) мы создаём Productivity Platform — единую платформу для автоматизации производственных процессов и внедрения искусственного интеллекта в Сбере. В основе платформы лежит DataLake — централизованное хранилище, которое накапливает и структурирует данные для аналитики, обучения AI-ассистентов и построения витрин. Цель создания платформы Productivity Platform — обеспечить единый и бесшовный путь для команд Банка, сократив производственные затраты благодаря максимальной автоматизации и применению искусственного интеллекта на каждом этапе производственного процесса. Команда DataLake отвечает за развитие и сопровождение холодного хранилища на базе Hadoop. Мы ищем специалиста, который поможет нам развить с нуля практики тестирования данных в нашей системе и выстроить процессы обеспечения качества данных на всех этапах их жизненного цикла. Стек технологий проекта: Python, PySpark, Airflow, Hadoop (Hive), Kafka, Postgres, CDC, OpenMetaData Обязанности · Разрабатывать и поддерживать автоматизированные тесты Data Quality для данных, хранящихся в Hadoop (Hive). · Интегрировать тесты в Airflow-пайплайны, обеспечивать их запуск по расписанию и мониторинг результатов. · Анализировать причины инцидентов с качеством данных, взаимодействовать с владельцами источников и потребителями данных. · Разрабатывать и внедрять метрики, правила и стандарты качества данных для DataLake. · Участвовать в развитии инфраструктуры тестирования данных, внедрять новые инструменты и подходы. Требования · Опыт работы с Hadoop/Hive, понимание принципов организации данных в DWH. · Уверенное владение Python и PySpark для написания тестов и обработки данных. · Опыт работы с Airflow: создание, отладка и поддержка DAG’ов. · Понимание принципов тестирования данных (Data Quality), опыт разработки автотестов для ETL-процессов. · Навыки работы с SQL, опыт анализа данных и поиска аномалий. · Будет плюсом: опыт работы с Kafka, CDC, Postgres. · Будешь стремиться погружаться в продукт, а не "просто писать код" Условия · Современный комфортный офис рядом с м. Кутузовская. · Ежегодный пересмотр зарплаты и годовая премия · Более 400 образовательных программ СберУниверситета. Возможность постоянно совершенствоваться и развивать профессиональные навыки. · Программа адаптации и помощь руководителя на старте. Мы поможем вам быстро влиться в коллектив и начать продуктивную работу. · Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа. Забота о вас и ваших близких — важный аспект нашего сотрудничества. · Корпоративный спортзал и зоны отдыха. · Ипотека выгоднее до 7% для каждого сотрудника. Специальные условия ипотечного кредитования сделают покупку жилья доступной. · Подписка СберПрайм+, скидки на продукты компаний-партнеров · Вознаграждение за рекомендацию друзей в команду Сбера. Привлекая новых талантливых специалистов, вы можете заработать дополнительное вознаграждение.
Похожие вакансии
Аналитик (Data Governance/Data Quality)
Договорная
Москва
Центральный банк Российской Федерации (Банк России)