Обязанности:
Rambler&Co занимает первое место среди медиахолдингов России по объему аудитории цифровых ресурсов — свыше 45,2 млн человек ежемесячно (по данным Mediascope, Cross Web, 2023). В него входят «Лента.ру», «Газета.Ru», «Чемпионат», портал «Рамблер», «Секрет фирмы» и ряд других медиаактивов. Благодаря различной тематической принадлежности площадок холдинг покрывает почти весь спектр интересов и потребностей различных аудиторий. «Рамблер» — ведущий портал Рунета, объединяющий новостной агрегатор, развлекательные и тематические медиа, сервисы и почту. Ежемесячная аудитория составляет десятки миллионов пользователей. Детальнее о проекте Рекомендательная система, которая подбирает для пользователей наиболее релевантный контент, повышая продуктовые метрики; Рекомендации строятся в рантайме на каждый заход пользователя на страницу с рекомендациями; Культура разработки: линтеры, тесты, code review на все выкатки, gitlab CI/CD; Нормальная документация и видео лекции с рассказом о проекте, ориентированные на DS; Команда состоит из 22 человек: DS (6 человек), DA, DE, backend, frontend, PM; Ищем ML engineer, а не классического DS. Чем предстоит заниматься? Офлайн эксперименты с новыми моделями бустинга + выкатка моделей (не только стандартный подбор фичей и гиперпараметров, но более разнообразные подходы: различные способы сбора датасета, семплирования и фильтрации выбросов, составления таргета и т.д.); Реализация новых фичей в офлайне для обучения и в рантайме для инференса моделей с ними; Новые эмбеддинги для контента и фичи на их основе; Улучшение качества проставления тегов для текстов; Другие NLP проекты; В целом, задачи со всех этапов разработки ML-моделей: от экспериментов с новыми фичами и написания пайплайнов загрузки логов до выкатки моделей в нагруженный прод и добавления новых мониторингов. Что мы ценим и ищем? DS стек (numpy, pandas, scikit-learn, xgboost/catboost); Классический ML (линейные/деревянные модели, метрики, валидация и т.д.); Код на python и SQL (написание и чтение); Коммерческий опыт разработки от 1.5 лет. Будет плюсом: ML-модели в проде Рекомендательные системы DL, NLP, pytorch postgres, clickhouse, redis Big data стек: hadoop, hive, pyspark Airflow Bash, git, CI/CD Алгоритмы и структуры данных Тервер, матстат, A/B-тесты В желательных требованиях хоть в каком-то пункте ожидаем хоть какой-то уровень. Чем больше пунктов и уровня, тем лучше.Отдельно про soft skills: мы очень ценим мотивированность, инициативность, самостоятельность и умение аргументировать выбор подхода/модели/метрики. Во многих случаях хорошие soft skills могут компенсировать недостаточный уровень hard skills :) Что тебя ждет? Официальное трудоустройство Топовое оборудование и весь необходимый софт ДМС со стоматологией, офисный врач, доплата больничного листа, корпоративные скидки Современный офис (Даниловская мануфактура, м. Тульская), бесплатный спорт в собственном спортзале от «Лиги Героев» Полный день в офисе, гибридный график или 100% дистанционный формат работы Бесплатная подписка на сервисы партнеров Насыщенная корпоративная жизнь