other

NLP Engineer (GigaChat Pretrain)

Более недели назад

З/П не указана

Город: Москва

СБЕР

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

Эта вакансия – участник пилота по использованию AI. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным. Попробуйте — и вы станете одним из первых, кто познакомится с ГигаРекрутером Сбера! Мы в GigaChat делаем core-технологию генеративной языковой модели: она пишет тексты, генерирует изображения, пишет код, отвечает на вопросы и ведёт диалоги. Прошлой осенью мы выпустили сильную русскоязычную модель GigaChat MAX уровня GPT-4 (метрики — в статье на Habr). Зимой выложили в открытый доступ одну из наших MoE-моделей. И на этом не остановились — двигаемся дальше! Сейчас у нас фокус в несколько направлений: Исследования и эксперименты. Стабилизация и развитие архитектур (новые виды attention, улучшение тестового стенда изменений). Методы улучшения обучения (оптимизация, лоссы и режимы вроде FIM/MTP, балансировка MoE). Скейлинг-законы (для гиперпараметров, качества и стоимости). Постоянный разбор свежих статей и идей индустрии. Инфраструктура и параллельные тренировки. 5-D параллелизм, ускорение мультимодальных и гигантских MoE-моделей на больших кластерах. Фреймворк распределённого обучения. Разработка GigaFSDP, эксперименты с FP8/mixed-precision, устойчивость и эффективность обучения на больших масштабах. Низкоуровневые оптимизации. Оптимизация операций на уровне CUDA/triton ядер, улучшение производительности NCCL, профилирование и устранение узких мест. Качество и метрики. Развитие оценки GigaChat: от международных олимпиадных задач до метрик, специфичных для русского языка. Ищем NLP Engineer, с которым будем делать GigaChat умнее. Для экспериментов у нас — кластер с большим числом A100/H100. обязанности Обязанности Доводить качество на русском до уровня ChatGPT и выше. Придумывать и проверять идеи, которые дают практический выигрыш. Помогать решать задачи внутренних клиентов Сбера — с прицелом на внешних пользователей. Следить за индустрией: читать статьи, быстро проверять гипотезы, делиться результатами. Требования Уверенный Python и PyTorch. База по алгоритмам и математике (линейная алгебра, оптимизация, вероятности). Опыт обучения DL-моделей: от «просто моделей» до больших. Теоретическое понимание алгоритмов распределенного обучения. Представление о текущем ландшафте LLM и трендах. Плюсом будет: Опыт с распределённым обучением (DDP/FSDP/параллелизмы), CUDA/NCCL/профилирование, MoE/FP8, мультимодальные модели, построение метрик качества. Даже если у тебя нет опыта с LLM, но ты много занимался NLP исследованиями или инженерными оптимизациями — не стесняйся откликнуться! Условия Удалённо по России. Возможность оформления в аккредитованную IT-компанию. Годовая премия по итогам работы до 6 окладов. Регулярный пересмотр зарплат. Корпоративный спортзал и зоны отдыха. Более 400 программ СберУниверситета для роста. Программа адаптации и помощь руководителя на старте. Крупнейшее DS&AI community — более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы. Расширенный ДМС, льготное страхование для семьи, корпоративная пенсионная программа. Ипотека для сотрудников по дисконтной программе. СберПрайм+ и скидки у партнёров. Бонус за рекомендации в команду.

Показать контакты

Имя не указано

Пожаловаться ID: 151940742

Похожие вакансии

NLP Engineer (GigaChat Pretrain)

Договорная

Москва

СБЕР

Senior ML Engineer (NLP, GigaChat Audio)

Договорная

Москва

СБЕР

Senior NLP Engineer

Договорная

Москва

СБЕР

ML Engineer (NLP)

Договорная

Москва

Центральный банк Российской Федерации (Банк России)

ML Engineer (NLP)

Договорная

Москва

Центральный банк Российской Федерации (Банк России)

Senior NLP Researcher (RnD GigaChat)

Договорная

Москва

СБЕР