Наша команда готовит данные для обучения LLM GigaSalute - это версия GigaChat-а для интеллектуального ассистента Салют. Салют работает на всех умных устройствах от SberDevices, а также на других поверхностях (Сбербанк Онлайн, 2GIS и другие) и обрабатывает десятки миллионов запросов пользователей в день. Наши задачи: подготовка данных для всех этапов обучения GigaSalute, создание и внедрение метрики оценки качества работы GigaSalute, организация разметки для GigaSalute, инициирование различных экспериментов для обучения базовой модели, обучение модели для обработки данных. Обязанности писать пайплайны анализа моделей перед отправкой в продакшн, пайплайны сбора тренировочных данных и пайплайны сбора разметки анализировать модели придумывать и внедрять метрики оценки качества работы GigaSalute инициировать различные эксперименты для обучения базовой модели доработка функционала для работы со смежниками Требования Знание Python на высоком уровне (алгоритмы, структуры данных, GIL, async - Pandas в разработке не используем); опыт работы с базами данных знание продуктовых и ML метрик знание и опыт применения математической статистики, теории вероятности. Будет плюсом: опыт подготовки данных для больших моделей. Условия комфортный современный офис рядом с м. Кутузовская гибридный формат работы(офис 1 день в неделю) оклад по результатам прохождения технического интервью корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа ипотека для сотрудников выгоднее до 4% бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.