other

ETL разработчик

21 ноября 2024

От 300 000 до 350 000 руб.

Город: Москва

Тарасова Ольга Сергеевна

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

Обязанности:

Современная российская IT компания, специализирующаяся на внедрении инструментов для повышения эффективности бизнес-процессов ищет будущего коллегу - ETL разработчика уровня Middle+ и выше. Нам есть что тебе предложить - уникальный проект, в котором предстоит работать, не имеющий аналогов в своей нише. Оставляй свой отклик, оперативно свяжемся и обсудим детали! Условия: З/п до 350 000 на руки (готовы обсуждать) - зависит от уровня специалиста; Формат работы: удаленка, 5/2 с гибким началом и окончанием рабочего дня; Официальное трудоустройство по ТК РФ c первого дня; Аккредитованная IT компания (льготная ипотека, отсрочка от призыва и бронь от мобилизации); Дополнительные условия: ДМС; Ежегодная индексация заработной платы. Задачи: Совместная работа с DBA-архитектором на проектах; Организация ETL-процессов выгрузки данных Apache Hudi таблиц из S3 в ODS-слой на Greenplum; Разработка трансформации данных ODS-слоя в DDS-слой; Имплементация различных CDC-методов (инкрементальный JOIN с двумя наборами данных, вычисление хэша с последующим diff); Разработка plpgsql-функций или аналогичной логики на Spark для трансформации данных, на основе логики существующего Python/T-SQL кода (MSSQL); Разработка ad-hoc аналитических запросов под PostgreSQL/Greenplum; Разработка DataQuality-тестов на скриптовом ETL (Pyhon, Java или Scala); Работа с AirFlow-операторами, разработка DAGs; Мониторинг и поиск проблемных мест при эксплуатации ADB (Greenplum). Требования: Понимание различий PostgreSQL & Greenplum; Понимание механизма работы QE/QD (query executor & query dispatcher), и как исполняется SQL-запрос в Greenplum-кластере, включая планы запросов (redistribute, broadcast, gather motions); Понимание механизма дистрибьюции данных на сегмент-инстансах Greenplum, и как исправлять перекосы данных (skews); Понимание разницы механизмов работы Heap & AOP (append-optimzed) таблиц в Greenplum, включая понимание “ограничений” колоночного формата хранения данных; Понимание различий между логическими моделями: звезды, снежинки и DataVault. Опыт на аналогичной должности от 4 лет; Опыт с технологическим стеком: Greenplum, PXF, gpfdist, AirFlow, Spark, Scala обязателен.

Имя не указано

Откликнуться
Разместить Резюме
Пожаловаться ID: 125079632

Похожие вакансии

Разработчик ETL

Договорная

Москва

Тинькофф

ETL разработчик

Договорная

Москва

Robusta

ETL разработчик

Договорная

Москва

Robusta

ETL разработчик

Договорная

Москва

Интерфакс

ETL разработчик

Договорная

Москва

Novo BI

Разработчик ETL

Договорная

Москва

ARK