Обязанности:
Привет! Это команда вертикальных поисков.Современный поиск на маркетплейсе — это не плоский список из тысяч карточек, а умная витрина, которая понимает намерение пользователя и сама группирует товары по тому, что ему важно. Покупатель, который вбивает «ноутбук», на самом деле ищет «игровой», «для учёбы ребёнку» или «тонкий для работы» — и наша задача показать ему эти тематические полки прямо в выдаче, без лишних кликов и фильтров.Мы называем такие полки нави-колдунами — это автоматически собираемые кластеры товаров внутри поисковой выдачи, которые упорядочивают её по понятным пользователю осям: сценарий использования, ценовой сегмент, тип покупателя, ключевая характеристика. Каждый колдун имеет название, описание и подборку релевантных товаров. Мы ищем DS-специалиста, который будет развивать стрим нави-колдунов: от выделения семантических осей категории до продакшн-ранжирования полок в реальной выдаче Ozon.Вы будете: Разрабатывать и внедрять модели кластеризации товаров для построения тематических полок в поисковой выдаче. Проектировать пайплайны автоматической генерации названий и описаний кластеров (в т.ч. с использованием LLM). Строить модели ранжирования полок и товаров внутри полок под интент пользователя. Работать с товарными эмбеддингами, признаками поведения пользователей и атрибутами карточек для повышения качества кластеризации. Заниматься построением пайплайнов обработки и сбора данных, разметкой и обучением моделей. Участвовать в полном ML-цикле: от исследования и создания прототипов до продакшн-внедрения, A/B-тестов и мониторинга моделей. Нам важно: Наличие фундаментальной математической базы, знание алгоритмов, математической статистики, классического ML и нейросетей. Понимание методов кластеризации, построения эмбеддингов и алгоритмов ранжирования (LTR). Опыт работы с современными архитектурами языковых моделей и эмбеддинг-моделей, в том числе обучение/дообучение своих моделей. Опыт работы с продуктами в области поиска, рекомендательных систем или рекламных технологий. Понимание принципов оценки качества ML-моделей в проде, постановки и анализа A/B-тестов. Будет плюсом: Опыт построения ассистентов или продуктов на базе LLM, генерация структурированного контента (названий/описаний). Знание технологий обработки больших данных, таких как Hadoop, Spark или аналогичные. Навыки работы с инструментами автоматизации ML-пайплайнов. Опыт работы с e-commerce данными: товарные графы, каталоги, пользовательские сессии.Похожие вакансии