Обязанности:
РОМИР – лидер исследований в России в сферах психологии, социологии, маркетинга, демографии и статистики, работаем более чем в 60 странах мира. Более 30 лет мы занимаемся глубинными исследованиями в евразийском пространстве, развивая инновационные инструменты, опираясь на фундамент социальных наук. Мы активно сотрудничаем с крупнейшими университетами, бизнесом и государственными организациями. Если вы стремитесь к инновациям и хотите быть частью динамичной компании, то эта вакансия для вас! Приглашаем присоединиться к нашей команде Data Science ассистента. Ключевая задача: работа в команде Data Science над задачами в области аналитики и обработки больших объёмов данных. Основной фокус — реализация ML-гипотез по подготовленным ТЗ, эксперименты с моделями и подготовка данных для обучения. С предоставлением отчёта по каждой гипотезе с описанием реализуемых подходов на основании выбранных метрик качества на тестовой выборке. Чем предстоит заниматься: Работа с данными. Сборка выборок из корпоративных витрин (SQL) по поставленным ТЗ. Разметка и валидация данных различными объёмами — для подготовки обучающих выборок, оценки качества моделей и контроля автоматической разметки. Формирование сбалансированных датасетов для дальнейшего обучения. Реализация ML-гипотез и LLM-пайплайнов. Имплементация поставленных гипотез: подготовка данных, обучение моделей, тестирование подходов (классический ML, эмбеддинги и векторные представления), построение пайплайнов на LLM через API и локально. Снятие метрик, выполнение экспериментов по чек-листу на разных параметрах, сравнение подходов, фиксация результатов в воспроизводимом виде, оформление отчётов. R&D. Участие в исследовательской части проектов: разбор актуальных статей и решений в области LLM и классического ML, поиск релевантных подходов под текущие задачи команды. Подготовка кратких обзоров найденных методов с оценкой применимости. Проверка перспективных подходов на пилотных выборках. Требования: Python: уверенное владение, знание основных библиотек (pandas, numpy, scikit-learn и пр,). Классический ML: понимание основных алгоритмов (линейные модели, деревья, градиентный бустинг и пр.), умение корректно подбирать метрики под задачу и интерпретировать результаты. Векторные представления: понимание эмбеддингов, умение работать с векторными моделями (sentence-transformers, embedding-модели), опыт работы с векторным поиском. LLM: понимание принципов работы языковых моделей, опыт построения промптов, работа с локальными моделями; ориентация в актуальных подходах (RAG, few-shot, structured output) SQL: уверенный пользователь. API: опыт использования API Git: базовая работа с ветками, коммитами, мерж. Условия: Работа в одной из самых динамично развивающихся компаний на российском исследовательском рынке; Работа с молодой командой профессионалов, которые горят своим делом и нацелены на результат; Возможность участия в самых крупных российских исследовательских проектах; Оформление в соответствии с ТК РФ. Комфортный современный офис в шаговой доступности от ст. м. Багратионовская, м. Фили и Парк Победы; Уровень заработной платы обсуждается с успешным кандидатом на собеседовании. График работы с 9.30 до 18.00, 5/2 суббота и воскресенье выходные.Похожие вакансии