Обязанности:
Российская IT-компания, разработчик тиражируемой интеллектуальной платформы по управлению данными. Основным продуктом компании является "Semantic MDM". Чем предстоит заниматься: Проектировать и внедрять NLP/LLM решения в продуктовые сценарии MDM: классификация, извлечение/нормализация атрибутов, дедупликация, поиск/вопрос-ответ по данным и документам; Строить retrieval + RAG пайплайны: подготовка корпуса, индексация, ранжирование, промптинг, постобработка, guardrails; Адаптировать и дообучать open-source LLM-модели под задачи (prompting, LoRA/QLoRA, PEFT-подходы), оптимизировать инференс (включая квантизацию — при необходимости); Выстраивать оценку качества: датасеты, разметка, метрики, регрессионные тесты для retrieval/RAG и качества LLM-ответов; Интегрировать ML/LLM-компоненты в продукт совместно с командами backend/frontend (API, контракты, требования к данным); Участвовать в выборе технологического стека и принимать архитектурные решения по ML части; Требования: Глубокое знание Python и опыт production-разработки(структура проекта, тесты, версионирование моделей, логирование/трассировка); Понимание архитектур трансформеров и опыт их применения для NLP-задач; Практический опыт NLP/LLM в реальных задачах: работа с PyTorch и transformers, понимание fine-tuning/adaptation подходов (например, PEFT/LoRA) и ограничений LLM; Опыт построения retrieval/RAG-компонентов: эмбеддинги, индекс, оценка качества retrieval; Умение проектировать и защищать решения: формулировать гипотезы, проводить эксперименты, анализировать результаты; Умение доводить модели до продакшена: сервисная интеграция, мониторинг качества/ошибок, работа с ограничениями latency/стоимости; Навыки написания чистого, поддерживаемого кода; Высшее образование; Знание английского языка для чтения и анализа технической документации; Приветствуется: Опыт сбора, разметки данных, знание основных инструментов и умение ими пользоваться; Опыт интеграции с LLM API (например, GigaChat, YandexGPT, DeepSeek или аналоги), работа со streaming-ответами; LangChain/LlamaIndex, tool calling/function calling, оркестрация агентных сценариев; Векторные/поисковые хранилища и движки: OpenSearch, pgvector, FAISS; опыт reranking; Условия: оформление по ТК РФ; заработная плата определяется на собеседовании; премии по результатам работы; возможность профессионального роста и развития; ДМС, оплачиваемый отпуск и больничные; возможна удаленная работа/гибрид.Похожие вакансии
От 200 000 до 300 000 руб.
Москва. Станции метро: Деловой центр, Москва-Сити
JFoRecruitment
Договорная
Москва. Станции метро: Деловой центр, Москва-Сити
Негосударственный Пенсионный Фонд Сбербанка
Договорная
Москва. Станции метро: Деловой центр, Москва-Сити
Лаборатория Касперского