Обязанности:
Наша команда решает задачу поиска релевантных рекламных объявлений для пользователя. Если пользователь видит только полезную рекламу, а рекламодатель быстро находит нужное число пользователей своего продукта — значит, мы хорошо сделали свою работу. Для этого мы собираем множество разнообразных данных о пользователях и строим модели, позволяющие извлекать из данных информацию о краткосрочных и долгосрочных интересах каждого пользователя.Мы ищем ML-специалиста, который готов погрузиться в рекомендательную систему с огромным количеством источников данных, обрабатывать различные типы данных для повышения эффективности рекламных продуктов. Задачи: разработка фич для моделей ранжирования рекламы; разработка моделей для обработки кликстрима пользователя; разработка и валидация метрик оценки качества моделей и интересов; формализация процессов сбора разнообразных данных, необходимых для обучения и валидации моделей. Требования: умение формулировать гипотезы и проверять их при помощи данных; умение аргументировать при помощи метрик, а при отсутствии метрик умение их разработать и провалидировать; экспертное владение Python и SQL; знание ML-алгоритмов, опыт обучения эмбеддингов и ранжирующих моделей; работа с большими данными, например Hadoop (Spark, Hive, HDFS) и Airflow. Будет плюсом: опыт использования RecSys-моделей: FM, ALS, LDA, etc.; опыт использования NLP-моделей: LSTM, Transformers, BERT, etc.; вы курсе современных статей с ведущих конференций (KDD, RecSys, NIPS, WWW, CIKM, ICML).