Обязанности:
Привет! Это команда ML ценообразования. Сейчас в команде 2 человека, которые сделали MVP – на A/B тестах стабильно позитивные результаты. Основная цель на ближайшее время – определить стратегию дальнейшего развития системы. Цель на долгосрок – разработать устойчивое решение, которое учитывает не только краткосрочную выгоду, но и сайд-эффекты и последствия. Сейчас пайплайн переводится с hadoop в сервисы, и в дальнейшем поддержкой production и всей технической стороной проекта будет заниматься соседняя команда, а мы сосредоточимся на математической составляющей задачи. Этот проект – борьба с шумными данными, сложными метриками и неочевидными решениями. Мы ищем человека, который готов бороться за каждую десятую процента на А/Б, за качество и безопасность решений, за долгосрочный эффект. Который не ищет легких путей, но хочет побеждать вместе с командой. Если процесс преодоления доставляет вам особое удовольствие, и вы хотите привнести в сильную команду свое видение – нам точно стоит познакомиться! Вы будете Анализировать большие объёмы данных с помощью PySpark для поиска неочевидных закономерностей. Исследовать и улучшать ML-решения на реальных шумных данных – от гипотезы до оценки влияния на А/Б-тесты (без погружения в production-инженерию: пайплайн и поддержку возьмёт соседняя команда). Разрабатывать и проверять новые факторы для моделей, добиваясь стабильного прироста метрик. Проектировать эксперименты и инструменты валидации, чтобы отделить реальный эффект от шума и случайностей. Оценивать долгосрочные последствия решений, выявлять и анализировать сайд-эффекты. Участвовать в архитектурных обсуждениях (как лучше строить фичи, валидацию, сценарии использования) без рутинной поддержки кода в проде. Нам важно Отличная математическая база. Коммерческий опыт в DS от 4 лет – обязательно с задачами, где данные были шумными или недостаточно разнообразными. Опыт работы с PySpark на реальных объёмах данных (именно для анализа и генерации фичей, а не для написания production-пайплайнов). Опыт постановки и интерпретации А/Б-тестов. Умение и желание копать в глубину: не остановиться на первом сработавшем решении, а проверять устойчивость, смотреть на сайд-эффекты, пробовать альтернативные подходы. Прагматизм и ориентацию на результат – умение быстро проверять гипотезы, при этом не скатываясь в бесконечный research. Будет плюсом Опыт в ML ценообразовании. Опыт успешного применения Causal Inference подходов.Похожие вакансии
Договорная
Москва. Станции метро: Деловой центр, Москва-Сити
АльфаСтрахование
Договорная
Москва. Станции метро: Деловой центр, Москва-Сити
Ренессанс cтрахование, Группа
От 3 500 до 4 350 руб.
Москва. Станции метро: Деловой центр, Москва-Сити
ПБК Менеджмент
Договорная
Москва. Станции метро: Деловой центр, Москва-Сити
АПТЕКА ВАША № 1
Договорная
Москва. Станции метро: Деловой центр, Москва-Сити
Федеральная сеть книжных магазинов Читай-город
Data Scientist (валидация ml моделей)
Договорная
Москва. Станции метро: Деловой центр, Москва-Сити
СБЕР