other

Middle Data Scientist

Более недели назад

З/П не указана

Город: Санкт-Петербург. Станции метро: Спортивная, Приморская, Василеостровская, Горный институт

DSCS.pro

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 1 года

Обязанности:

Привет! Мы, команда лаборатории прикладного искусственного интеллекта в ФИЦ РАН, создаем решения, объединяющие фундаментальные исследования, образование и индустрию. Работаем совместно с внешними командами, в том числе из Сбера и РАНХиГС. Ищем коллегу на позицию младшего графического дизайнера для работы над представлением наших решений. ЗАДАЧИ: Работать с LLM и RAG: Разрабатывать и внедрять подходы по улучшению качества ответов языковых моделей за счет retrieval-augmented generation. Оптимизировать стратегии поиска и реранжирования. Создавать интеллектуальных агентов: Проектировать и реализовывать агентов на современных фреймворках (Pydantic AI, LangGraph). Решать классические NLP-задачи: Извлечение и связывание именованных сущностей (NER/NEL) из неструктурированных русскоязычных текстов. Моделировать: Обучать и оценивать классификаторы и ранжирующие модели, обеспечивая их стабильную работу в продакшене. Анализировать данные и качество: Проводить глубокую оценку качества ML-пайплайнов, выдвигать и проверять гипотезы по улучшению метрик. Готовить данные и признаки для обучения моделей. ТРЕБОВАНИЯ: Обязательно наличие профильного высшего образования Уверенный Python (ООП, API, чистый код) и SQL (sqlalchemy/alembic). Сильные NLP-навыки и опыт работы с русским текстом: решение задач NER/NEL, понимание морфологии и синтаксиса. Опыт построения LLM-агентов на современных фреймворках (LangGraph, Pydantic AI или аналоги). Понимание retrieval-подходов (RAG, семантический поиск) и опыт работы с векторными БД. Хорошее понимание ML: классификация, ранжирование, метрики, подготовка признаков. БУДЕТ ПЛЮСОМ: Опыт файн-тюнинга/инференса BERT / RoBERTa, работа с GigaChat. Знакомство с ELK и современными архитектурами LLM (MoE/Dense). НАШ СТЕК: NLP: Natasha, Pymorphy, DeepPavlov, Transformers Агенты и пайплайны: Pydantic AI, LangGraph Backend / Data: SQLAlchemy, Alembic УСЛОВИЯ: Работа в офисе, возможен гибрид Обсуждаемая заработная плата

Показать контакты

Имя не указано

Пожаловаться ID: 152976839

Похожие вакансии

Data Scientist Middle

Договорная

Санкт-Петербург. Станции метро: Спортивная, Приморская, Василеостровская, Горный институт

Koronatech

Data Scientist middle (GenAI)

Договорная

Санкт-Петербург. Станции метро: Спортивная, Приморская, Василеостровская, Горный институт

СБЕР

Data Scientist

Договорная

Санкт-Петербург. Станции метро: Спортивная, Приморская, Василеостровская, Горный институт

Банк Санкт-Петербург

Data Scientist

Договорная

Санкт-Петербург. Станции метро: Спортивная, Приморская, Василеостровская, Горный институт

Специальный Технологический Центр (ООО СТЦ)

Data Scientist

Договорная

Санкт-Петербург. Станции метро: Спортивная, Приморская, Василеостровская, Горный институт

НеоБИТ

Data Scientist

От 150 000 до 200 000 руб.

Санкт-Петербург. Станции метро: Спортивная, Приморская, Василеостровская, Горный институт

ЭКАН