Обязанности: Совместная работа с командой над внедрением моделей в технологический стек продуктов компании. Разработка и тестирование ML/DL пайплайнов для анализа текстовых данных. Развёртывание моделей в производственной среде, оптимизация и деплой на CPU/GPU кластеры. Реализация MLOps-процедур при работе с моделями. Требования: От 3-х лет опыта в разработке NLP-моделей, знание современных подходов (SOTA). Глубокое понимание архитектуры и принципов работы больших лингвистических моделей (LLM) и генеративных трансформеров типа BERT, GPT, LLAMA. Знание основ программирования (объектно-ориентированное программирование, паттерны проектирования, Web API, очереди). Опыт работы с TensorFlow, PyTorch, OpenCV и другими фреймворками. Навыки оптимизации моделей машинного обучения для повышения производительности (high-performance или real-time). Опыт сервинга больших языковых моделей (Ollama, vLLM, LocalAI и др.) Опыт применения Lora-adapters для тюнинга языковых моделей или распределённого обучения трансформерных моделей на GPU-кластерах (Ray) Опыт работы с различными источниками данных: PostgreSQL, ClickHouse, Greenplum, Cassandra, Hive, Kafka, Faiss, Qdrant и другие. Опыт работы с инструментами MLOps: KubeFlow, MLFlow, Apache Airflow и другими. Условия: Совместная работа с командой над внедрением моделей в технологический стек продуктов компании. Оформление по ТК в аккредитованную ИТ-компанию Формат работы: удалённый или гибрид (офис в нескольких минутах ходьбы от метро Беговая) Конкурентная заработная плата (обсуждается индивидуально: в зависимости от опыта, хард скиллов и выбранной позиции) ДМС со стоматологией с первых недель работы