Обязанности: Исследование, проектирование и внедрение ML-моделей в областях компьютерного зрения (CV) и обработки естественного языка (NLP). Развертывание и оптимизация пайплайнов инференса на GPU-серверах для рабочих нагрузок в продакшне. Разработка мультимодальных AI-функций (текст, изображения, видео, аудио) и их интеграция в продукт. Масштабирование производительности и пропускной способности моделей для работы с быстро растущей пользовательской базой. Тесное взаимодействие с бэкенд-инженерами для создания готовых к продакшну API. Проведение экспериментов, A/B-тестов и оценка моделей на основе взаимодействия с реальными пользователями. Требования: 5+ лет практического опыта в разработке ML/AI. Глубокие знания Python и фреймворков машинного обучения (PyTorch или TensorFlow). Прочные знания в областях NLP (LLM, эмбеддинги, трансформеры) и CV (генерация изображений, диффузионные модели, обработка видео). Опыт работы с обучением и инференсом на GPU. Хорошее знание методов оптимизации моделей (квантизация, дистилляция, батчинг, кэширование). Практический опыт вывода ML-сервисов в продакшн. Опыт работы с видео AI-моделями. Английский язык - B2. Будет плюсом: Знание высоконагруженных систем. Знакомство с инструментами мониторинга и аналитики (Weights & Biases, MLflow, Grafana и т.д.). Опыт работы с чат-ботами, мессенджерами или диалоговыми AI. Условия: Работа в продуктовой компании. Удаленный формат работы. Атмосфера стартапа. Ключевое влияние на продукт. Заработная плата + опционы.
Похожие вакансии
Lead/Senior ML Engineer (NLP/RAG)
Договорная
Москва
Центральный банк Российской Федерации (Банк России)