Вакансия компании: ООО "КОМБЛОК" О проекте:Разработка экосистемы ИИ-сервисов для автоматизированного анализа контента и аудитории в мессенджерах. Продукт включает в себя модули real-time парсинга данных, семантического анализа, генерации ИИ-отчетов, а также высоконагруженные ML-модели (LLM, RAG).Мы предлагаем: Стабильный доход: конкурентоспособная заработная плата. Выплаты 2 раза в месяц по 50% или 1 раз в месяц (согласовывается с сотрудником). Гибкий формат: график 5/2. На старте (первые 2 месяца) - работа в офисе для глубокого погружения в инфраструктуру, далее возможен переход на гибридный формат. Сложные задачи: реальный опыт построения AI-инфраструктуры с нуля на собственном железе без ограничений облачных вендоров. Профессиональную среду: мотивированная команда, отсутствие бюрократии, возможность самостоятельно принимать архитектурные решения. Обязанности: Миграция и развертывание: перенос существующих сервисов проекта из облачной инфраструктуры Docker во внутренний контур Bare Metal. Управление GPU: развертывание, конфигурация и обеспечение доступности видеокарт NVIDIA для контейнеров (CUDA, NVIDIA Container Toolkit). Автоматизация: написание комплексных скриптов автоматизации, пайплайнов и внутренних тулингов на Python и Bash. Администрирование платформ: оркестрация контейнеров в Kubernetes/Docker Swarm, управление дисковыми хранилищами, базами данных и очередями. Эксплуатация: плановое обновление, масштабирование, мониторинг (метрики, логи, алерты) и быстрое реагирование на инциденты. Архитектурное планирование: сайзинг железа, проектирование отказоустойчивости bare-metal кластеров и документирование процессов. Обязательные требования: Опыт миграции : успешный практический опыт переноса production-окружения из облаков на собственные сервера. Контейнеризация и оркестрация: глубокие знания Docker, Docker Compose и Kubernetes (архитектура, сеть, bare-metal ингрессы). GPU-инфраструктура: опыт проброса и оркестрации видеокарт NVIDIA в контейнеры, знание NVIDIA Container Runtime, мониторинг VRAM и Compute нагрузки. Работа с хранилищами (Диски/Storage): понимание работы дисковых подсистем на физических серверах (RAID, LVM, монтирование, оптимизация IOPS для БД и ML-моделей, Ceph/NFS как плюс). Продвинутая автоматизация: уверенное владение Python для написания системных скриптов, интеграций по API и автоматизации рутины (+ Bash). Инфраструктура как код и CI/CD: опыт работы с Ansible (управление конфигурациями серверов) и GitLab CI (построение пайплайнов деплоя). Системный уровень: понимание Linux, сетевой модели OSI, маршрутизации и безопасности закрытого контура. Базы данных: опыт эксплуатации и тюнинга PostgreSQL, Redis. Желательные навыки: MLOps стеки: знакомство с инструментами оркестрации ML-пайплайнов (MLflow, Kubeflow) и реестрами моделей. Настройка мониторинга: опыт самостоятельного развертывания и настройки Prometheus, Grafana, VictoriaMetrics, Loki / ELK с нуля под задачи проекта. Резервное копирование: проектирование и автоматизация стратегий бэкапов. Требуемый опыт: Не менее 3 лет в роли DevOps. Опыт работы с bare-metal серверами и поддержкой инфраструктуры в закрытых/собственных контурах. Способность самостоятельно принимать технические решения и доводить миграцию сервисов до production-статуса.
Похожие вакансии
Договорная
Москва. Станции метро: Багратионовская
АО «ОТП Банк» (JSC «OTP Bank»)