other

Data Quality Engineer

Более недели назад

З/П не указана

Город: Москва

СБЕР

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

В трайбе SberWorks (Сбер) мы создаём Productivity Platform — единую платформу для автоматизации производственных процессов и внедрения искусственного интеллекта в Сбере. В основе платформы лежит DataLake — централизованное хранилище, которое накапливает и структурирует данные для аналитики, обучения AI-ассистентов и построения витрин. Цель создания платформы Productivity Platform — обеспечить единый и бесшовный путь для команд Банка, сократив производственные затраты благодаря максимальной автоматизации и применению искусственного интеллекта на каждом этапе производственного процесса. Команда DataLake отвечает за развитие и сопровождение холодного хранилища на базе Hadoop. Мы ищем специалиста, который поможет нам развить с нуля практики тестирования данных в нашей системе и выстроить процессы обеспечения качества данных на всех этапах их жизненного цикла. Стек технологий проекта: Python, PySpark, Airflow, Hadoop (Hive), Kafka, Postgres, CDC, OpenMetaData Обязанности · Разрабатывать и поддерживать автоматизированные тесты Data Quality для данных, хранящихся в Hadoop (Hive). · Интегрировать тесты в Airflow-пайплайны, обеспечивать их запуск по расписанию и мониторинг результатов. · Анализировать причины инцидентов с качеством данных, взаимодействовать с владельцами источников и потребителями данных. · Разрабатывать и внедрять метрики, правила и стандарты качества данных для DataLake. · Участвовать в развитии инфраструктуры тестирования данных, внедрять новые инструменты и подходы. Требования · Опыт работы с Hadoop/Hive, понимание принципов организации данных в DWH. · Уверенное владение Python и PySpark для написания тестов и обработки данных. · Опыт работы с Airflow: создание, отладка и поддержка DAG’ов. · Понимание принципов тестирования данных (Data Quality), опыт разработки автотестов для ETL-процессов. · Навыки работы с SQL, опыт анализа данных и поиска аномалий. · Будет плюсом: опыт работы с Kafka, CDC, Postgres. · Будешь стремиться погружаться в продукт, а не "просто писать код" Условия · Современный комфортный офис рядом с м. Кутузовская. · Ежегодный пересмотр зарплаты и годовая премия · Более 400 образовательных программ СберУниверситета. Возможность постоянно совершенствоваться и развивать профессиональные навыки. · Программа адаптации и помощь руководителя на старте. Мы поможем вам быстро влиться в коллектив и начать продуктивную работу. · Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа. Забота о вас и ваших близких — важный аспект нашего сотрудничества. · Корпоративный спортзал и зоны отдыха. · Ипотека выгоднее до 7% для каждого сотрудника. Специальные условия ипотечного кредитования сделают покупку жилья доступной. · Подписка СберПрайм+, скидки на продукты компаний-партнеров · Вознаграждение за рекомендацию друзей в команду Сбера. Привлекая новых талантливых специалистов, вы можете заработать дополнительное вознаграждение.

Показать контакты

Имя не указано

Пожаловаться ID: 153844158

Похожие вакансии

Data Quality Specialist

Договорная

Москва

BostonGene Technologies

Аналитик (Data Governance/Data Quality)

Договорная

Москва

Центральный банк Российской Федерации (Банк России)

Data Engineer

Договорная

Москва

СБЕР

Data Engineer

От 243 700 руб.

Москва

Сбербанк России, ПАО

Data Engineer

От 240 000 руб.

Москва

Сбербанк России, ПАО

Data Engineer

Договорная

Москва

ТЕХНОНИКОЛЬ