Обязанности:
Наш клиент, health приложение (10 млн пользователей в 130 странах и 180 тысяч пятизвездочных оценок в сторах) открывает позицию Ведущего Data инженера, который вместе с командой с нуля будет создавать data lakehouse с нетривиальным набором данных. У компании на сегодняшний день один из самых богатых дата сетов в мире, в области образа жизни людей. Компания прибыльная, находится на 44 месте в категории Health&Fitness Top Grossing в США. Темпы роста компании за последние 4 года - 95% в год. В компании работает больше 100 человек, сотрудники работают из 24 стран и говорят преимущественно на русском языке. 95% сотрудников которые работают более 1 года являются акционерами компании. Данные в компании - ключевая часть продукта, и используются командами для создания новых пользовательских фич. Вы будете заниматься полным циклом обработки данных и обеспечивать продуктовые команды качественными данными. Также вы будете разрабатывать пайплайны обработки данных для некоторых продакшен фич приложения, где требуется RT или NRT обработка и сервинг. Какие ключевые технологии используются и опыт в чем обязателен: Python, Apache Spark, AWS, SQL и NoSQL базы данных. Компания предлагает: Зарплата исходя из ваших ожиданий Свободный график и страна проживания Оформление по договору оказания услуг, у вас будет свобода в выборе дней для «перезагрузки» и переездов — дей–оффы за счет компании, компания не отслеживает количество дней вашего отпуска (безлимитный отпуск) , есть опционная программа В компании динамично, интересно, компания живет на пике технологий и инноваций Для отклика на вакансию ответьте пожалуйста на несколько вопросов: 1. На какой уровень оплаты вы ориентируетесь2. В какой стране вы живете3. Был ли у вас опыт построения data lakehouse Отметьте уровни владения по программам, от 1-5.(1 знаю, 2 пробовал, 3 редко использовал, 4 использовал часто и знаю хорошо, 5 знаю на профессиональном уровне и могу обучать) - Python- Apache Spark- AWS- SQL и NoSQL базы данных