Data Engineer

2 июля 2026

З/П не указана

Город: Москва. Станции метро: Новокузнецкая, Третьяковская, Китай-город

PARI

Город: Москва. Станции метро: Новокузнецкая, Третьяковская, Китай-город

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

PARI

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

Обязанности:

ИЩЕМ ТИММЕЙТА В КОМАНДУ УПРАВЛЕНИЯ ДАННЫМИ Ты будешь отвечать за проектирование и развитие отказоустойчивых пайплайнов потоковой обработки данных, влияя на скорость и качество решений внутренних команд. С тебя — самостоятельность, инженерная глубина и готовность улучшать существующую платформу, с нас — сложные real-time-задачи, технологичная среда и свобода превращать экспертизу в решения, которыми пользуются аналитики, ML-специалисты и продуктовые команды. В чем твой вызов? — Проектировать, разрабатывать и поддерживать высоконагруженные пайплайны для обработки потоковых данных в режиме real time — Развивать процессы для обработки данных и передачи результатов в целевые системы и внешние API — Настраивать интеграции в связке Kafka, Flink и ClickHouse, обеспечивая стабильное движение данных между источниками и потребителями — Очищать, фильтровать, трансформировать и обогащать сырые потоки данных для создания качественных витрин и датасетов. — Проектировать быстрые витрины с минутными и другими оперативными срезами для аналитических и ML-сценариев — Оптимизировать существующие потоковые и пакетные процессы, повышая их производительность, надежность и масштабируемость — Разрабатывать переиспользуемые модули, шаблоны и кастомные расширения, которые помогут быстрее запускать новые процессы обработки данных — Внедрять механизмы мониторинга, логирования и проверки целостности данных на всех этапах их движения — Анализировать сбои и узкие места, находить причины проблем и повышать отказоустойчивость real-time-инфраструктуры — Участвовать в code review и поддерживать единые инженерные стандарты внутри команды. Три совпадения — и нам точно по пути: — Ты можешь самостоятельно спроектировать, реализовать и вывести в эксплуатацию решение без постоянного контроля — Тебе интересны сложные задачи на стыке потоковой обработки, высоких нагрузок и аналитических систем, где результат твоей работы напрямую влияет на скорость принятия решений — Ты не ограничиваешься поддержкой уже работающих процессов: ищешь возможности для оптимизации, предлагаешь переиспользуемые решения и внимательно относишься к качеству данных и кода. Какие скилы нам важны: — Есть коммерческий опыт построения и оптимизации высоконагруженных систем потоковой обработки данных — Уверенно работаешь с Apache Kafka и понимаешь принципы построения решений на базе брокеров сообщений — Имеешь практический опыт работы с Apache Flink на уровне самостоятельной разработки и оптимизации production-процессов — Хорошо знаешь ClickHouse и понимаешь, какие движки и архитектурные подходы использовать для обработки real-time-данных — Уверенно владеешь Python и умеешь писать поддерживаемый production-код — Работал с Airflow и понимаешь принципы оркестрации процессов. Глубокая экспертиза необязательна, но важно уверенно ориентироваться в инструменте — Умеешь интегрировать стриминговые решения, брокеры сообщений, API и хранилища данных в единый технологический контур — Проектировал решения с учетом масштабирования, производительности, стабильности и отказоустойчивости — Умеешь настраивать мониторинг, логирование, алертинг и проверки качества данных — Разрабатывал переиспользуемые модули, внутренние библиотеки или шаблоны для ускорения запуска новых пайплайнов — Участвовал в code review и умеешь аргументированно предлагать улучшения в архитектуре и коде. Что дальше, если случился мэтч? → Рекрутер → Техническое интервью → Бизнес кейсы (интервью в офисе) → СБ и офер

Показать контакты

Контакт:

Имя не указано

При звонке сообщите, что Вы нашли вакансию на Rabix.ru

Откликнуться

Разместить Резюме

Распечатать Пожаловаться ID: 155513810