Мы команда, которая занимается подготовкой данных для обучение GigaChat. Обязанности · писать и запускать код для сбора данных с разных платформ · собирать параллельные корпусы текста для машинного перевода · обрабатывать сырые данные из интернета · оптимизировать объем данных для экономии ресурсов на обучение, удалять дубли и схожий контент · использовать существующие или обучать новые языковые модели для решения различных задач. Требования · наличие диплома ШАДа по направлению Natural language processing. Условия · комфортный современный офис рядом с м. Кутузовская · возможность выбрать удобный график – офис/гибрид · годовая премия · корпоративный спортзал и зоны отдыха · более 400 образовательных программ СберУниверситета для профессионального и карьерного развития · расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа · ипотека для сотрудников выгоднее до 4% · бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров · вознаграждение за рекомендацию друзей в команду Сбера.