Обязанности:
Мы в поиске Middle Data Scientist в команду рекомендательный систем. Чем предстоит заниматься: Рекомендации на Главной странице (нейросетевые кандидаты, LLM-сценарии, ранжирование) Рекомендации на странице продукта (похожие товары, "с этим товаром покупают", Metric learning, MTMH-кандидаты) Рекомендация размера (размерные эмбеддинги пользователей и товаров) Мы ожидаем: Подтвержденный опыт в области анализа данных и машинного обучения от 3 лет; Опыт работы с SQL, Hadoop, Hive, Spark; Владение Python, Linux, методами работы с большими данными; Опыт работы с ML библиотеками: Scikit-learn, CatBoost/XGBoost, PyTorch, Spark ML; Знания теории вероятностей и математической статистики; Знания в области машинного обучения, прогнозного моделирования и методов статистического анализа; Знание алгоритмов и структур данных; Высшее образование в области прикладной математики, информационных технологий, информатики и т.п; Английский язык на уровне технического чтения. Подойдут два профиля: Плотный коммерческий опыт в RecSys Нет опыта в RecSys, но есть плотный коммерческий опыт с Deep Learning (работа с NLP, последовательностями, сигналами, временными рядами), и желание применить его в RecSys Как мы работаем: Пишем на Python 3.6+ и PySpark 3.0; Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру; Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов; Используем Airflow для управления ML-пайплайнами и запуском их по расписанию; В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач; Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов; В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.Похожие вакансии
Data Scientist / Deep Learning Engineer (рекомендательные системы)
Договорная
Москва. Станции метро: Крылатское, Молодежная, Мнёвники, Терехово
СБЕР
Data Scientist в команду RecSys
Договорная
Москва. Станции метро: Крылатское, Молодежная, Мнёвники, Терехово
2ГИС
Data Scientist / Deep Learning engineer (Нейронные сети / Time series / Transformers)
От 300 000 руб.
Москва. Станции метро: Крылатское, Молодежная, Мнёвники, Терехово
Spice IT
Договорная
Москва. Станции метро: Крылатское, Молодежная, Мнёвники, Терехово
Лига Цифровой Экономики
Договорная
Москва. Станции метро: Крылатское, Молодежная, Мнёвники, Терехово
МТС Банк
От 50 000 до 100 000 руб.
Москва. Станции метро: Крылатское, Молодежная, Мнёвники, Терехово
АйТи Фо Ю