other

Data Scientist в проект GigaChat

Более недели назад

З/П не указана

Город: Москва. Станции метро: Кутузовская

СБЕР

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

Обязанности:

Мы ищем Data Scientist для работы над данными pretrain языковых моделей типа ChatGPT Куда: прод команда больших языковых моделей в SberDevices Задачи: майнить данные: писать и запускать код для сбора данных с разных платформ (где есть много данных, которых нет в Common Crawl) собирать параллельные корпусы текста для машинного перевода очищать данные: обрабатывать сырые данные из интернета, выкидывать рекламные блоки, непонятные блоки, использовать существующие или обучать новые языковые модели для решения подобных задач убирать дубликаты: оптимизировать объем данных для экономии ресурсов на обучение, удалять дубли и схожий контент, использовать существующие или обучать новые языковые модели для решения подобных задач Требования: диплом ШАДа с заветными тремя словами: Natural language processing Условия: масштабные, сложные и разнообразные задачи, находящиеся на острие инноваций сильная команда отзывчивых профи и гуру, которые всегда помогут текущий объем датасета 4Тб текста, будет намного больше фидбек и возможность увидеть результаты своей работы в продукте своя digital-платформа для развития ключевых IT-компетенций, внутренние и внешние конференции и проф. сообщества Сбера много корпоративных плюшек расширенная программа ДМС (возможность подключения родственников), страхование жизни специальные условия по кредитам/ипотеке, скидки от компаний-партнёров знаменитый офис на Кутузовском проспекте с парковкой, спортзалом, массажными креслами и возможностью выбора формата работы (офис или гибрид) атмосфера стартапа и надёжность гиганта.

Имя не указано

Откликнуться
Разместить Резюме
Пожаловаться ID: 120950484

Похожие вакансии

Middle NLP Data Scientist – GigaChat

Договорная

Москва. Станции метро: Кутузовская

СБЕР

Data Scientist

От 6 000 до 15 000 руб.

Москва. Станции метро: Кутузовская

BrainShells

Data scientist

Договорная

Москва. Станции метро: Кутузовская

СберЗдоровье

Data scientist

Договорная

Москва. Станции метро: Кутузовская

СБЕР

Data Scientist

Договорная

Москва. Станции метро: Кутузовская

Экспобанк

Data Scientist

Договорная

Москва. Станции метро: Кутузовская

СБЕР