Обязанности:
Вам предстоит: Тестирование и оценка моделей машинного обучения: Проведение экспериментов с различными ML моделями, анализ их производительности и выявление оптимальных решений для новых сервисов; Участие в разработке новых сервисов: Активное сотрудничество с командой для создания новых решений на основе искусственного интеллекта, направленных на улучшение бизнес-процессов и оптимизацию существующих систем; Ведение проектной документации: Создание и поддержание актуальной проектной и технической документации, включая описания архитектуры, алгоритмов и методов, используемых в разработке; Исследование и внедрение новых технологий: Постоянный мониторинг актуальных тенденций в области машинного обучения и искусственного интеллекта, а также поиск способов их применения в рамках компании. Мы ожидаем: Глубокая экспертиза в Python, уверенное использование asyncio, threading и multiprocessing, а также навыки в профилировании и решении задач, связанных с памятью и процессором.; Опыт работы с FastAPI и Pydantic v2: знание асинхронной архитектуры и уверенное владение структурой проектов; Опыт работы с PostgreSQL, Redis, MongoDB, грамотное проектирование схем, индексация, выбор между ORM и raw SQL; Знание Docker и Docker Compose, базовое понимание Kubernetes; Опыт в настройке RabbitMQ, Kafka, Celery и Redis, включая реализацию retry-логики, управление дубликатами и dead-letter очередями, а также экшн локеры; Опыт разработки микросервисов, выделение высоконагруженных зон, кэширование и создание stateless приложений; Умение быстро собрать интерфейс на HTMX/Bootstrap или Streamlit. Будет преимуществом: Опыт работы с LLM, включая OpenAI, Claude и DeepSeek: навыки в кастомизации промптов, оптимизации затрат и качества, а также в использовании функциональных вызовов и потоковой передачи данных; Знания в области RAG-систем: опыт построения полного пайплайна от чанкинга до эффективного поиска информации. Понимание выбора векторных баз данных и графов знаний; Умение создавать чат-ботов ассистентов с цепочками вызовов, memory, fallback, multi-agent; Знание решений TorchServe, Triton и ONNX, а также понимание квантования модели и интеграции локальных моделей с GPT; Опыт работы с MLOps (MLflow, Weights & Biases, мониторинг метрик, логирование, отслеживание версий). Мы предлагаем: Работу в крупной международной компании; Официальное оформление по ТК РФ; Полностью белую заработную плату; График: 5/2, полностью удаленный формат работы; Возможность посещения офиса - м. Проспект Мира (5 минут пешком). Дополнительные бонусы: Работа в дружной команде и развитая корпоративная жизнь; Возможность профессионального и карьерного роста, гибкое отношение к новым идеям; Возможность повышения квалификации и переподготовки по выбранной специальности в нашем корпоративном университете с получением сертификата или диплома; Программа ДМС; Корпоративные скидки в фитнес-клубы; Премиум доступ к платформе со скидками от партнеров; Реферальная программа для сотрудников; Подарки на день рождения; Доплата к больничным и отпускам до полной заработной платы.Похожие вакансии