Обязанности:
Наш продукт-универсальное кроссплатформенное приложение, объединяющее в одной экосистеме передовые AI-сервисы для бизнеса и людей. Мы ищем опытного и мотивированного AI- Engineer, который присоединится к нашей команде .Вы будете ключевым игроком в обеспечении стабильности и производительности нашей платформы, автоматизируя процессы, оптимизируя инфраструктуру и внедряя лучшие практики. Резидент инновационного центра "Сколково".Аккредитованная в Минцифры РФ IT компания. Обязанности: Проектирование и разработка AI-агентов: Создание многошаговых логических цепочек (chains) и графов (graphs) для решения комплексных задач с использованием LangChain и LangGraph. Создание и оптимизация RAG-систем: Построение пайплайнов для индексации, поиска и дополнения контекста для LLM. Работа с векторными базами данных (Qdrant — наш основной стек). Работа с LLM: Деплой, оптимизация и поддержка open-source моделей (Llama, Mistral, Mixtral и др.) для инференса в production-среде. Файн-тюнинг моделей: Адаптация и дообучение существующих моделей под специфические задачи и домены нашей компании для повышения качества и релевантности ответов. MLOps и инфраструктура: Разработка и поддержка MLOps-пайплайнов для развертывания и мониторинга моделей, обеспечение их стабильности и производительности. Интеграция и API: Создание API для интеграции разработанных AI-сервисов в основную платформу компании. Исследование и прототипирование: Постоянный поиск и тестирование новых подходов, фреймворков и моделей в области Generative AI. Требования: Уверенное владение Python и опыт коммерческой разработки от 3 лет. Практический опыт работы с фреймворками LangChain и LangGraph. Опыт работы с векторными базами данных, в первую очередь с Qdrant. Глубокое понимание принципов работы LLM, RAG, трансформерных архитектур и техник prompt engineering. Опыт деплоя ML-моделей в production (Docker, Kubernetes, FastAPI/Gradio). Опыт файн-тюнинга (fine-tuning) open-source LLM. Аналитический склад ума и умение находить элегантные инженерные решения для сложных продуктовых задач. Будет большим плюсом: Опыт работы с экосистемой Hugging Face (Transformers, PEFT, TRL). Опыт использования инструментов для оптимизации инференса (vLLM, TensorRT-LLM). Опыт работы с облачными платформами (AWS, GCP, Azure) и их AI/ML сервисами. Понимание классических алгоритмов и структур данных. Вклад в open-source проекты. Условия: Работу на переднем крае технологий Generative AI, возможность реализовать самые смелые идеи. Конкурентную заработную плату и систему бонусов ( обсуждаем индивидуально). Сильную команду инженеров, увлеченных своим делом. Гибкий график и возможность работать удаленно из любой точки мира.
Похожие вакансии