other

ML/Data Engineer

23 апреля 2026

З/П не указана

Город: Москва

СБЕР

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

Обязанности:

Мы разрабатываем высоконагруженную AI-платформу, которая помогает юристам готовить международные договоры. Состоит из трёх больших блоков: Динамический UI - сочетает в себе окно поиска по базам знаний и область для договоров, графиков и форм. Мультиагентная система – обрабатывает запросы пользователя, формирует договоры, редактирует, переводит и т.д. Гибридная база знаний – сочетает семантический (векторный) поиск и графовые связи. Первый этап отбора на эту вакансию – общение с AI-рекрутером: после отклика вам на почту и в чат на платформе HeadHunter придет приглашение побеседовать с ГигаРекрутером в Telegram диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным! Чем предстоит заниматься: разработка и поддержка ETL-пайплайнов для парсинга законов Гонконга, английских статутов и санкционных источников (OFAC, EU, UK) построение гибридной базы знаний: векторное хранилище Milvus, графовая БД Neo4j, PostgreSQL для метаданных проектирование модели данных для договоров, законодательных норм, санкционных списков и графовых связей настройка автоматического ежесуточного обновления санкционных списков с оповещением об изменениях fine-tuning юридических эмбеддинг-моделей (LegalBERT) и/или малых LLM для извлечения сущностей создание бенчмарков и метрик качества поиска (Hit Rate, MRR, Recall) и защиты от галлюцинаций организация версионирования данных и моделей (DVC, MLflow) с возможностью отката при ошибках Мы ожидаем, что ты имеешь: опыт работы с текстами: парсинг PDF/HTML, чистка, нормализация и Python: pandas, numpy, transformers, PyTorch практическую работу с векторными БД (Milvus / Qdrant / Weaviate): индексация, гибридный поиск, управление схемой опыт с графовыми БД (Neo4j, Cypher): построение онтологий, запросы связей знание реляционных БД: PostgreSQL, включая полнотекстовый поиск и pgvector опыт оркестрации ETL (Airflow / Prefect / Dagster) и работы с брокерами сообщений (Kafka) MLOps: DVC, MLflow, деплой моделей в Docker/K8s; fine-tuning через Hugging Face (PEFT, LoRA) production-опыт с LangGraph (Python) и LangChain, а также понимание TypeScript-версии LangGraph (или готовность освоить). Будет плюсом: понимание common law / права Гонконга опыт парсинга санкционных XML/CSV/JSON практика с Spark/Dask, OWL/RDF. Работа у нас – это: работа в стартап-культуре: минимум бюрократии, гибкие процессы и быстрые релизы гибридный график (2-3 дня в неделю из дома) современный офис на ул Поклонной, 3к3 ежегодный пересмотр зарплаты и годовая премия более 400 образовательных программ СберУниверситета для профессионального и карьерного развития программа адаптации и помощь наставника на старте расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа льготная ипотека и кредитование от Сбера бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.

Показать контакты

Имя не указано

Пожаловаться ID: 153332175

Похожие вакансии

Data scientist/ML engineer

Договорная

Москва

Ренессанс cтрахование, Группа

Data Scientist / ML Engineer

Договорная

Москва

АПТЕКА ВАША № 1

ML Engineer (ASR, GigaChat Data)

Договорная

Москва

СБЕР

ML Engineer (Multimodal GigaChat Data)

Договорная

Москва

СБЕР

Data Engineer (Python/Django/ML)

Договорная

Москва

Hello, Doc!

ML Engineer / Data Scientist (С++)

От 250 000 до 350 000 руб.

Москва

НЭПТ