other

ML-инженер / Инженер данных (Middle)

Более недели назад

З/П не указана

Город: Москва

СБЕР

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 1 года

Наша команда занимается разработкой внутренних сервисов для разработчиков. Это коллаборативная платформа для организации разработки, портал баз знаний и интерактивным ассистентом, помогающий проходить весь путь разработки продукта от идеи до внедрения. Сейчас мы активно внедряем ИИ в различные сценарии использования продуктов. Наш стек: Python, Postgres, LangChain, OpenSearch. Код в Bitbucket, трекер JIRA, CI/CD Jenkins, закатываем в Docker, деплоим в облако. Обязанности Проектирование и поддержка ETL/ELT-процессов для данных под RAG: сбор, очистка, нормализация, чанкинг, генерация эмбеддингов. Создание AI-агентов (в том числе мульти-агентных систем). Разработка и поддержка Python-сервисов. Работа с «сырыми» данными из внутренних систем Сбера (wiki, тикеты, логи, код) — их структурирование и подготовка для LLM. Исследование и подготовка данных для обучения моделей, adhoc. Тестирование собственного кода и ревью чужого. Требования Опыт разработки AI-агентов (в том числе мульти-агентных систем) с использованием библиотек оркестрации (LangGraph, LangChain, AutoGen, CrewAI). Понимание и практическое применение MCP протокола (Model Context Protocol) для интеграции агентов с внешними инструментами и сервисами. Глубокое знание RAG (Retrieval-Augmented Generation): построение пайплайнов индексации, продвинутые техники ретрива (HyDE, self-query, reranking), работа с чанкингом и эмбеддингами. Опыт работы с LLM через API и локально: системные промпты, few-shot, инструменты (function/tool calling), потоковая обработка (streaming). Хорошее знание Python (асинхронное программирование, типизация, dataclasses/Pydantic) для разработки сервисов на базе агентов. Git, Docker (сборка образов, композ, работа в облачном окружении). Графовые базы данных. Будет плюсом (и это важно для нас): Опыт подготовки неидеальных, «живых» данных — парсинг, дедупликация, обработка мусора, нормализация текста из разных источников (Markdown, Confluence, Jira, код-базы). Понимание метрик качества данных для RAG — полнота, связность чанков, релевантность эмбеддингов, затраты на индексацию vs качество retrieval. Готовность копаться в логах и трейсах агента, чтобы понять, почему он плохо находит нужный контекст (и исправить это на уровне данных или промпта). Условия Официальное трудоустройство согласно ТК РФ Белая заработная плата (оклад + годовая премия) Возможность обучения за счет компании Страхование (от несчастных случаев, ДМС) График работы: 5/2 (офис или гибрид) Оздоровительные программы для детей сотрудников Дисконт-программы от компаний партнеров (фитнес, страхование, туризм) Льготное кредитование, ипотека Экспертная и талантливая команда, у которой можно многому научиться Культура открытости и взаимовыручки: наша команда состоит из людей, вовлеченных в процесс и не безразличных к тому, что они делают Высокая скорость процессов и возможность быстро увидеть свой вклад Возможность влиять на процесс и результат Адрес: БЦ Даниловский Форт., М. Тульская / Нагатинская / Верхние Котлы

Показать контакты

Имя не указано

Пожаловаться ID: 154868039

Похожие вакансии

ML-инженер (middle)

Договорная

Москва

СОГАЗ

ML-инженер (Middle)

Договорная

Москва

Riverstart (ООО Риверстарт)

ML инженер (Middle)

Договорная

Москва

Страховая компания Сбербанк страхование

Middle+/Senior ML-инженер

Договорная

Москва

СОГАЗ

Middle/Senior ML-инженер (Норникель)

До 250 000 руб.

Москва

ИЦ АЙ-ТЕКО

Инженер машинного обучения (ML-инженер, Junior/Middle)

Договорная

Москва

Эйч-Эль-Эль