Обязанности:
У нас петабайты реальных логов событий пользователей и возможности быстро проверять гипотезы, которые влияют на продукт, которым пользуются десятки миллионов людей. Мы делаем прогрессивные вещи и применяем cutting edge технологии. Направление поиска возглавляет Игорь Кураленок, в прошлом руководитель отдела оценки качества поиска Yandex, R&D лаборатории в Huawei и автор десятков научных пейперов про поиск, ML и распределенные вычисления. Наш стек: Python, Pyspark, Clickhouse, Airflow, Mlfow. Вам предстоит: Заниматься полным циклом DS/ML задач для улучшения качества алгоритма ранжирования товаров в поисковой выдаче. Работать с данными от их исследования до автоматизации пайплайнов для регулярных расчетов датасетов и фичей на pyspark. Искать подходящие ML решения для бизнес-задач, планировать и проводить оффлайн и онлайн (А/Б) эксперименты. Примеры задач: Оптимизация сложных целей компании с помощью ранжирования (multi-objective ranking, дизайн композитных функций потерь). Устранение различных bias-ов из моделей (positional bias, cold start problem). Дизайн и разработка оффлайн-метрик, которые будут хорошо предсказывать результаты А/Б экспериментов. Адаптация алгоритмов под нужды отдельных товарных категорий (одежда, продукты) Мы ожидаем: Опыт работы в Data Science от 3х лет Уверенные теоретические знания ML Сильный python Уверенное знание hadoop - стека, опыт работы с большими данными Как плюс: Опыт работы с рекомендательными системами / NLP Опыт работы с высоконагруженными системами Опыт дизайна и проведения AB тестов Мы предлагаем: Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce. Свободу действий в принятии решений. Достойный уровень заработной платы. Профессиональную команду, которой мы гордимся. Возможность развиваться вместе с нашим бизнесом.