Мы — команда ML-инженеров, специализирующаяся на инфраструктуре данных и валидации моделей. Наша команда создает критически важные инструменты для оценки качества моделей, разрабатывает пайплайны обработки данных и фокусируется на генерации высококачественных технических и кодовых данных для обучения моделей. Наши основные направления: • Validation Metrics — инструменты валидации и замера моделей • Data Engineering — пайплайны чистки и синтеза данных • Code Technical Data — генерация кодовых/технических данных • MLOps — хостинг и использование open source моделей • Model Training — эксперименты с LoRA и SFT. Если тебе интересно создавать инфраструктуру для развития LLM и работать с передовыми технологиями в области данных — приходи к нам. Обязанности разработка инструментов для валидации и замера качества моделей и систем контроля качества данных создание метрик оценки производительности и точности LLM автоматизация процессов тестирования и бенчмаркинга, фильтрации и предобработки построение и оптимизация пайплайнов чистки и синтеза данных генерация высококачественных кодовых и технических датасетов создание синтетических данных для обучения моделей на технических задачах поддержка инфраструктуры для хостинга open source моделей интеграция и использование open source модели в продуктовых решениях обучение LoRA адаптеров для экспериментальных задач проведение SFT обучения в рамках исследований данных анализ результатов экспериментов и интерпретация подходов. Требования отличное знание Python и опыт работы с ML-библиотеками (LangChain/LangGraph, PyTorch, llm-foundry, verl) опыт работы с LLM (как open source: Llama, Mistral, Qwen, так и проприетарными: GPT, Claude) понимание принципов работы с данными для обучения моделей: сбор, очистка, валидация навыки построения ML пайплайнов и автоматизации процессов понимание процессов, знание подходов к валидации и тестированию моделей машинного обучения понимание основ MLOps и работы с контейнеризацией (Docker). Будет плюсом: опыт с фреймворками для работы с агентами и RAG знание подходов к fine-tuning (LoRA, QLoRA, SFT) опыт работы с системами версионирования данных и экспериментов (DVC, MLflow, W B) понимание принципов работы с кодовыми данными и техническими текстами опыт развертывания и мониторинга ML-моделей в production. Условия крупнейшее DS AI community — более 600 DS-специалистов банка дайджест о самых последних разработках в области DS AI и отчеты с крупнейших конференций мира возможность выбрать удобный формат работы: гибрид или офис комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32 ежегодный пересмотр зарплаты, годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа ипотека выгоднее до 7% для каждого сотрудника бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.
Похожие вакансии