other

Data Scientist

Более недели назад

З/П не указана

Город: Москва. Станции метро: Белорусская

Интернет-энциклопедия РУВИКИ

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

Обязанности:

Рувики - это новый проект интернет-энциклопедии. Мы собираем и публикуем только достоверную информацию и создаем удобную информационную площадку для наших пользователей. Цель проекта - привнести новые возможности и стандарты в мир информации. Наша команда активно растет и сейчас мы ищем Data Scientist. Если ты готов решать задачи, которые до тебя никто не решал, мыслишь масштабно и обладаешь гибкостью мышления - добро пожаловать к нам в команду. Технологии/инструменты Объем хранилища: 10TB текстовый контент + 60TB графика и видео. Чем вы будете заниматься: Решением задач бизнеса с применением технологий машинного обучения и ИИ в интернет-энциклопедии; Анализом данных, формирование предложений на основе анализа данных; Принятием решений по созданию/оптимизации моделей, выбор лучших практик; Дообучение генеративных LLM для различных задач (включая, суммаризацию, QA, генерацию диалогов); Внедрением моделей вместе с командой разработки; Презентацией результатов; Работа над моделями мультиязычного перевода (включая модели выравнивания параллельных корпусов, определения языка). Мы ожидаем: Реальный опыт разработки NLP-моделей, знание SOTA-подходов, умение их объяснить команде. Понимание архитектуры и принципов устройства и обучения больших лингвистических моделей (LLM) и генеративных трансформеров типа GPT/Bert: Tokenizing, Position Encoding, (Masked) Multihead Attention, Batch/Layer Normalization и т.д. Понимание принципов обучения и применения моделей обучения с подкреплением (Reinforced Learning), умение выстраивать распределенное и глубокое обучение. Понимание основных методов Machine Learning (regressions,clustering,decision trees,ит.д.), уверенное знание когда их применять, а когда не надо. Умение выстраивать Pipeline машинного обучения и быстрое развертывание их в применении к GPT-подобным моделям — Domain Data Mining / Augmentation / Unsupervised Learning/ SFT / RLHF / Validation / Self Confidence / Active Learning. Поддержка актуальных знаний в весах моделей(Active Learning) или на внешней дифференцируемой памяти по принципу Query-Key-Value, доверие к Confidence решений, способы преодолеть Token Window Size и другие. Чем мы можем Вас заинтересовать: Интересные задачи, крутые кейсы, возможность выйти на новый профессиональный уровень. 100% «белая» заработная плата, официальное трудоустройство по ТК РФ с первого дня. Полная занятость, офисный или комбинированный формат работы. Пятидневная рабочая неделя, с пн-пт. Шаговая доступность от метро Белорусская. Дружный и неравнодушный коллектив профессионалов. Программа ДМС после успешного прохождения испытательного срока. Фрукты, печеньки, чай/кофе и другие приятности. Мы всегда соблюдаем размеренный и разумный режим труда. Мы любим, холим и лелеем талантливых и целеустремлённых людей, способных достигать поставленных целей. Если Вы дочитали до этого момента это точно не случайно. Значит, нас уже что-то связывает. Предлагаем Вам откликнуться на эту вакансию и стать частью нашей команды!

Имя не указано

Откликнуться
Разместить Резюме
Пожаловаться ID: 110507178

Похожие вакансии

Data Scientist

Договорная

Москва. Станции метро: Белорусская

Детский мир

Data Scientist

Договорная

Москва. Станции метро: Белорусская

АШАН Ритейл Россия

Data Scientist

Договорная

Москва. Станции метро: Белорусская

СБЕР

Data Scientist

Договорная

Москва. Станции метро: Белорусская

СБЕР

Data Scientist

Договорная

Москва. Станции метро: Белорусская

ПСБ (ПАО «Промсвязьбанк»)

Data Scientist

Договорная

Москва. Станции метро: Белорусская

ОКБ