Обязанности:
За последний год мы превратили данные из побочного результата работы продуктовых систем в полноценный продукт: строим lakehouse, развиваем self-service платформу и помогаем бизнес-командам быстрее превращать сырые события в надежные витрины, метрики и аналитические продукты.Сейчас масштаб задач растет, поэтому нам нужен инженер, которому интересны сложные распределенные системы, качество данных, прозрачные процессы и ощутимый бизнес-импакт. Чем предстоит заниматься Развивать Lakehouse как единую точку входа для ad-hoc аналитики и data-продуктов. Улучшать CDC- и streaming-процессы на базе Kafka, Debezium и Spark Streaming. Ускорять путь от сырых событий до production-ready витрин. Повышать надежность, наблюдаемость и качество данных. Развивать self-service инструменты для аналитиков, продуктовых и бизнес-команд. Работать с batch и streaming pipelines в production-среде. Помогать командам использовать данные как продукт, а не как разрозненный набор таблиц. Стек PySpark, Airflow, ClickHouse, Trino, PostgreSQL, Kafka Connect, Debezium, Kubernetes, Iceberg, dbt. Что для нас важно Практический опыт в Data Engineering: Python, SQL, orchestration и production data pipelines. Опыт работы с Airflow или другими оркестраторами. Понимание batch и streaming processing, опыт работы со Spark / PySpark. Опыт работы с lakehouse- и аналитическим стеком: Trino/Presto, ClickHouse, Iceberg/Parquet/DeltaLake. Опыт с Kafka, Kafka Connect, Debezium или другими event streaming инструментами. Инженерное мышление: умение думать про надежность, стоимость, качество данных, поддержку и влияние изменений на пользователей. Почему это интересно Мы строим Data Platform как продукт, а не просто набор пайплайнов: от ingestion, CDC и streaming до lakehouse, self-service инструментов и production-ready витрин для бизнеса. Даем широкую зону ответственности и возможность влиять на архитектурные решения, платформенные подходы и то, как команды внутри компании работают с данными. Здесь много сложных инженерных задач: надежный streaming, CDC, Spark, Iceberg/Trino/ClickHouse, качество данных, наблюдаемость, стоимость запросов и production reliability. У нас современный стек: PySpark, Airflow, ClickHouse, Trino, PostgreSQL, Kafka Connect, Debezium, Kubernetes, Iceberg, dbt. Мы сохранили скорость и инициативность стартапа, но уже отстроили зрелые процессы: понятные цели, production-подход, ответственность за результат и прозрачную коммуникацию. Формируем измеримые цели всей командой и смотрим не только на факт выполнения задач, но и на их влияние на бизнес, пользователей данных и скорость работы продуктовых команд. Работаем в команде сильных специалистов, где ценится глубина экспертизы, инженерное мышление и способность предлагать улучшения, а не просто закрывать тикеты. Команды слушают и слышат друг друга: мы работаем с бизнесом, аналитиками и продуктами как партнеры. Что мы предлагаем: Удаленка из любой точки мира или уютный офис в Ташкенте У нас можно расти в инженерном или управленческом треке, а еще выстроена регулярная оценка перформанса Платим на уровне топовых компаний российского рынка Обучение и развитие — мы поддерживаем как внутри компании, так и за ее пределами (митапы, конференции, профессиональное обучение, публикации). А еще помогаем развивать личный бренд База — комьюнити профессионалов с желанием делать круто. Приятный бонус — ДМС в привязке к вашей локации, обучение и другие плюшкиПохожие вакансии