other

Data Scientist NLP Middle/Middle+

6 июля 2024

От 180 000 руб.

Город: Москва. Станции метро: Давыдково

Лаборатория Наносемантика

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 1 года

Обязанности:

«Наносемантика» — ведущий разработчик технологий искусственного интеллекта. Мы являемся крупнейшим игроком российского рынка ИИ-решений. Наши компетенции: нейронные сети, голосовые роботы и системы анализа больших данных. Мы разрабатываем гибридные решения, использующие как нейросетевые архитектуры, так и классические алгоритмы машинного обучения и анализа данных. В свою дружную команду мы приглашаем специалиста Data Scientist NLP (уровня Middle/Middle+): Чем предстоит заниматься: -Разработкой и внедрением решений на основе трансформеров для задач типа Text Classification, Token Classification, Text Generation и классических алгоритмов машинного обучения; Регулярным код-ревью 1–2 джунов и ситуационным наставничеством; Развертыванием моделей машинного обучения в виде сервисов с использованием FastAPI, Docker и инструментов Model Serving; Презентацией промежуточных результатов коллегам и заказчикам; Поиском решений инженерных и исследовательских задач в ходе проектов; Построением и отладкой пайплайнов извлечения и предобработки данных, обучения и инференса моделей; Выполнением необходимых интеграций с внешними сервисами; Разбором статей и реализацией архитектур нейронных сетей, функций потерь и оптимизаторов. Мы ожидаем: Опыт работы: 2+ лет; Подтвержденный опыт решения задач NLP; Культура организации воспроизводимых экспериментов; Свободное владение Python 3 и навык писать читаемый код; Практический опыт работы с FastAPI, Docker, Git; Уверенное понимание процессов развертывания моделей; Отличные коммуникативные навыки и умение работать в команде; Хорошая математическая база и алгоритмы; Опыт работы с PyTorch (также плюсом будет TensorFlow/Keras); Понимание работы механизма внимания, энкодеров/декодеров, sequence2sequence моделей и хорошее представление о нейросетевых архитектурах BERT, GPT, T5; Понимание и опыт практического применения алгоритмов машинного обучения (sklearn, xgboost и пр.); Базовые навыки работы с библиотеками для обработки текстов (nltk, pymystem, pymorphy, spacy, natasha); Опыт автоматизации обучения моделей с помощью Apache Airflow. Будет плюсом: Опыт работы с индустриальными системами аннотирования данных и сопровождения группы разметки; Опыт использования Explainable AI на табличных и текстовых данных; Подкованность в русскоязычных датасетах, знание их особенностей и недостатков; Опыт квантизации моделей; GitLab CI/CD и k8s; Участие в соревнованиях по машинному обучению.Мы предлагаем: Профессиональный рост и развитие через обучение и поддержку со стороны команды; Возможность работать с высококвалифицированными специалистами; Возможность осваивать новые технологии и повышать уровень своих навыков; Адекватное руководство, отсутствие бюрократии; Оформление по ТК РФ с первого рабочего дня; Полностью официальная заработная плата: оклад по результатам собеседования; ДМС для сотрудников (включая бизнес стоматологию); Испытательный срок - 3 месяца; Соблюдение норм ТК РФ. Что ждёт интересного: Молодой коллектив, интересная и динамичная работа; Возможность получения льгот (компания имеет it-аккредитацию); Возможности для профессионального и карьерного роста; Возможность посещения профильных мероприятий - конференции и прохождение курсов, необходимые сотруднику для развития.

Имя не указано

Откликнуться
Разместить Резюме
Пожаловаться ID: 117226721

Похожие вакансии

Middle Data Scientist (NLP)

Договорная

Москва. Станции метро: Давыдково

Гринатом

Middle NLP Data Scientist – GigaChat

Договорная

Москва. Станции метро: Давыдково

Сбербанк России, ПАО

Middle NLP Data Scientist – GigaChat

Договорная

Москва. Станции метро: Давыдково

СБЕР

Data scientist (Middle/Middle+)

Договорная

Москва. Станции метро: Давыдково

РСХБ-Интех

Data scientist (Middle/Middle+)

Договорная

Москва. Станции метро: Давыдково

РСХБ-Интех

Data Scientist (middle)

Договорная

Москва. Станции метро: Давыдково

МегаФон