Обязанности:
Чем предстоит заниматься Разработка и оптимизация ML-моделей в направлениях CV и NLP/LLM. Создание и развитие RAG-систем, работа с векторными БД, эмбеддингами и графовыми поисками. Оборачивание моделей в production-ready сервисы (FastAPI, Docker). Оптимизация инференса и настройка пайплайнов обучения. Построение инфраструктуры для обучения, мониторинга и деплоя моделей. Требования Уверенные знания Python, опыт работы с PyTorch, Transformers, scikit-learn, pandas, numpy. Практический опыт в Computer Vision (CVAT, LabelStudio). Опыт с NLP/LLM, построением RAG-систем, векторными БД (LangChain, E5/RuBERT). Навыки написания API (FastAPI), понимание асинхронности, упаковка моделей в сервисы. Знание методов ускорения инференса (ONNX, TensorRT, Triton Inference Server, vLLM). Опыт с MLflow, Airflow, понимание CI/CD для ML. Работа под Linux, знание Docker, взаимодействие с Kafka/RabbitMQ. Опыт работы с PostgreSQL, MongoDB, Qdrant, Neo4j. Будет плюсом Опыт работы с Graph RAG и гибридным поиском. Знание инструментов мониторинга (Prometheus, Grafana, Langfuse). Технологический стек RAG / LLM: Qdrant, LangChain, RAGAS, Hybrid Search, Reranking, Langfuse, vLLM ML / DL: PyTorch, Transformers, CLIP, CatBoost, scikit-learn, TF-IDF, FastText Backend / API: FastAPI, SQLAlchemy, Alembic, Pytest MLOps / CI/CD: MLflow, Airflow, Triton, GitLab CI/CD Infra & Data: Docker, Prometheus, Grafana, Kafka, RabbitMQ, S3 (Minio), CVAT, LabelStudio Условия Оформление по ТК РФ в аккредитованной IT-компании Полностью удалённый формат работы ДМС со стоматологией (по всей России) Страхование жизни и путешествий Корпоративная мобильная связь и ноутбук Система премирования — квартальная и годовая Программа BestBenefits со скидками Health Care: ежемесячные медицинские консультацииПохожие вакансии