Обязанности:
Rambler&Co занимает первое место среди медиахолдингов России по объему аудитории цифровых ресурсов — свыше 45,2 млн человек ежемесячно (по данным Mediascope, Cross Web, 2023). В него входят «Лента.ру», «Газета.Ru», «Чемпионат», портал «Рамблер», «Афиша» и ряд других медиаактивов. Благодаря различной тематической принадлежности площадок холдинг покрывает почти весь спектр интересов и потребностей различных аудиторий. Сейчас находимся в ML-разработчика в Отдел по разработке и внедрению AI портала Рамблер. Задачи: Разработка и тестирование алгоритмов RAG и LORA для генерации вопросов и ответов; Создание алгоритмов для ведения свободного диалога с пользователем, включая фактчекинг и фильтрацию; Анализ и сравнение результатов "Картины дня" после обработки редакцией и версий, созданных моделью; Разработка пайплайна для суммаризации полезного контента; Настройка навыков виртуального ассистента; Создание и индексация векторных поисковых индексов для алгоритмов RAG. Ожидания от кандидата (опционально): Опыт работы в роли Data Scientist от 3 лет, предпочтительно в области обработки естественного языка (NLP); Уверенные знания и опыт работы с библиотеками машинного обучения и NLP, такими как TensorFlow, PyTorch, Hugging Face и др.; Опыт работы с алгоритмами RAG и LORA.; Владение Python; Знание SQL и опыт работы с базами данных.; Работа с большими языковыми моделями (LLM), понимание архитектуры и принципов работы LLM, опыт использования популярных библиотек для работы с LLM, умение выполнять тонкую настройку (fine-tuning) моделей под конкретные задачи, создание и тестирование промтов (Prompt Engineering), опыт тестирования и оптимизации промтов, оценка производительности моделей (Benchmarking), создание бенчмарков для оценки качества работы моделей, знание метрик для оценки NLP-задач; Знание особенностей задач NLP, опыт работы с текстовыми данными: предобработка, токенизация, лемматизация, стемминг, векторизация. Классификация, кластеризация, генерация, NER; Навыки работы с поисковыми системами и задачами поиска, понимание принципов работы поисковых систем, знакомство с Elasticsearch, опыт создания и оптимизации поисковых запросов, умение работать с семантическим поиском. Условия: Официальное трудоустройство; ДМС со стоматологией, офисный врач, доплата больничного листа, корпоративные скидки; Современный офис (Даниловская мануфактура, м. Тульская), бесплатный спорт в собственном спортзале от «Лиги Героев»; Бесплатная подписка на сервисы партнеров; Полный день в офисе, гибридный график или 100% дистанционный формат работы; Льготные условия ипотеки в рамках зарплатного проекта; Насыщенная корпоративная жизнь.Похожие вакансии
Редактор статей на тему здоровья (портал «Рамблер»)
Договорная
Москва. Станции метро: Тульская
Rambler&Co
Автор статей на тему жизненных ситуаций (портал «Рамблер»)
Договорная
Москва. Станции метро: Тульская
Rambler&Co