other

Senior ML Engineer (LLM, RAG, Agents)

27 апреля 2026

З/П не указана

Город: Москва

Газпромбанк

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

Обязанности:

ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ: Строить системы извлечения и анализа ключевой информации из документов (PDF/сканы/HTML/DOCX), парсинг web-сайтов; Разрабатывать RAG-системы, включая выбор эмбеддингов, стратегии чанкинга, гибридный поиск (BM25+dense), reranking, обучение ретривера, генератора, Reward-модели, мониторинг качества; Обучать/дообучаать LLM на multi-node/multi-GPU: SFT/PEFT/LoRA, SFT+DPO, проводить распределённое обучение (FSDP/DeepSpeed), профилировать и оптимизировать; Отвечать за инференс и оптимизацию больших языковых моделей: внедрение и настройка vLLM, TensorRT‑LLM, Triton; реализация батчинга, спекулятивного декодирования и квантования; оптимизация соотношения качества, латентности и стоимости инференса; Проводить оценку качества: дизайн датасетов и сценариев, автоматические метрики (RAGAS, faithfulness, precision/recall), human-in-the-loop, онлайн-эксперименты и A/B. МЫ ЖДЕМ, ЧТО ВЫ: Имеете не менее 5 лет опыта в области ML/DS и не менее 2 лет работы с LLM в промышленной эксплуатации, а также можете продемонстрировать подтверждённые кейсы внедрений (с метриками, ссылками или результатами); Обладаете экспертизой в извлечении информации: умеете работать с NER, проектируете схемы и онтологии, обеспечиваете структурированный вывод (в том числе через JSON Schema и constrained decoding), выполняете постпроцессинг и валидацию данных; Имеете практический опыт работы с RAG: владеете векторными БД (Pinecone, Weaviate, Qdrant, Milvus), реализуете гибридный поиск и rerankers, разрабатываете стратегии чанкинга и аннотации метаданными, управляете свежестью индекса; Занимались разработкой агентных систем: работали с LangChain, LangGraph или LlamaIndex, проектировали и оркестрировали инструменты, реализовывали обработку ошибок; Имеете опыт многоузловой и многоGPU‑тренировки LLM: владеете PyTorch, FSDP/DeepSpeed, запускаете обучение на Slurm или K8s, проводите профилирование и выявляете узкие места; Умеете проводить fine‑tuning и организовывать инференс для открытых и проприетарных моделей (например, Qwen, Gemma), а также работаете с OpenAI API; Уверенно владеете Python и PyTorch, хорошо знакомы с экосистемой Hugging Face (Transformers, Tokenizers, PEFT, Accelerate), имеете опыт работы с MLflow или ClearML; Умеете работать с данными из документов: применяете OCR‑решения (VLM, PaddleOCR, Surya и др.), парсите PDF, HTML, DOC, XML; Обладаете базовым пониманием смежных областей (классификация, кластеризация, обработка речи), чтобы корректно выбирать подход: использовать LLM или классические методы ML; Владеете английским языком на уровне, достаточном для чтения профессиональных статей и технической документации. БУДЕТ ПЛЮСОМ, ЕСЛИ ВЫ: Можете предоставить ссылки на GitHub с реализованными RAG‑системами, демонстрирующими ваш практический опыт; Имеете опыт формулирования бизнес‑требований и разработки концептуального дизайна для LLM‑приложений, включая проработку сценариев использования и функциональных спецификаций; Умеете рассчитывать и аргументированно обсуждать с заказчиками финансовый эффект от внедрения LLM‑решений, можете привести примеры расчётов экономического эффекта из реализованных проектов; Принимали участие в соревнованиях и хакатонах, посвящённых разработке чат‑ботов и RAG‑систем, и можете продемонстрировать достигнутые результаты или решения; Обладаете пониманием классических NLP‑задач и имеете практический опыт их реализации (классификация текста, извлечение сущностей, суммаризация и др.), умеете сопоставлять их с возможностями LLM; Имеете опыт в прод‑инженерии и MLOps: работаете с Docker и Kubernetes, настраиваете мониторинг (Prometheus, Grafana), внедряете CI/CD‑пайплайны, интегрируете сервисы через REST, Kafka или gRPC; Обладаете опытом работы в доменно‑специфичных сферах с интенсивным использованием документов (финтех, юриспруденция), понимаете особенности обработки и анализа текстов в этих областях. ЧТО МЫ ПРЕДЛАГАЕМ: Достойный уровень вознаграждения; ДМС со стоматологией с первого месяца работы; Отпуск 33 дня; Полное соблюдение ТК РФ.

Показать контакты

Имя не указано

Пожаловаться ID: 152678277

Похожие вакансии

Lead/Senior ML Engineer (NLP/RAG)

Договорная

Москва

Центральный банк Российской Федерации (Банк России)

Lead/Senior ML Engineer (NLP/RAG)

Договорная

Москва

Центральный банк Российской Федерации (Банк России)

ML/NLP Engineer (LLM, AI-агенты, RAG)

Договорная

Москва

СБЕР

AI-инженер (LLM, RAG, ML)

Договорная

Москва

Банк ПСБ

Senior ML Engineer AI Agents (блок Финансы)

Договорная

Москва

СБЕР

Senior ML Engineer AI Agents (блок Финансы)

Договорная

Москва

СБЕР