Обязанности:
Umojo - один из ведущих разработчиков платформенных решений в сфере мобильности, контакт-центров, аналитики данных и сетевой безопасности. Мы помогаем бизнесу повышать эффективность и улучшать клиентский опыт. Платформа Umojo Nexus лежит в основе всех решений компании и помогает муниципалитетам, операторам парковок и бизнесу эффективнее работать с клиентами и городскими сервисами. Благодаря точным AI-решениям на базе камер и широкой интеграции с отраслевыми системами, Umojo предоставляет инструменты для аналитики и управления парковкой и мобильностью - как на улицах, так и вне их. О РОЛИ В роли Senior Python Engineer вы будете разрабатывать и внедрять голосовые LLM-агенты, формирующие новое поколение взаимодействия с пользователями - превращая миллионы ежегодных обращений в сфере парковки и мобильности в бесшовные AI-диалоги. Это возможность с нуля строить продакшн-системы на стыке голосовых технологий, LLM и инфраструктуры реального времени. Мы ищем опытного Python-инженера, который воспринимает GenAI как платформу для разработки решений, а не как временный тренд. Важно иметь сильное инженерное мышление, умение быстро двигаться без потери качества и быть готовым работать в среде с формирующимися процессами. ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ: Проектирование и реализация пайплайнов голосовых LLM-агентов в реальном времени с интеграцией в платформу Umojo Nexus - полный цикл от дизайна до продакшна Разработка высоконагруженных асинхронных микросервисов на FastAPI с поддержкой одновременных голосовых сессий и задержкой менее секунды Проектирование и поддержка RAG-пайплайнов полного цикла: от загрузки документов и их разбиения до индексации и поиска в VectorDB Оркестрация логики работы AI-агентов (LangChain / LangGraph): управление состоянием, инструментами и fallback-логико Работа с очередями сообщений (RabbitMQ) для обработки событий Контейнеризация, деплой и поддержка сервисов в Docker с упором на надежность и стабильность Взаимодействие с продуктовой, data и платформенной командами для улучшения ключевых метрик агентов (точность, latency, first-call resolution) ТРЕБОВАНИЯ Обязательные: 6+ лет коммерческой разработки на Python. Уверенное владение AsyncIO (не базовый уровень) Английский язык уровня C1+ (устный и письменный) - ежедневная работа с коллегами из США Практический опыт работы в продакшене с FastAPI, Docker, gRPC, WebRTC и RabbitMQ или аналогичными системами очередей Опыт разработки LLM-агентов с использованием LangChain или LangGraph и LlamaIndex Подтвержденный опыт проектирования и оптимизации RAG-пайплайнов (эмбеддинги, выбор VectorDB, chunking, оптимизация поиска) Опыт работы как с реляционными базами данных (SQL), так и с VectorDB Будет плюсом: Так как архитектура ориентирована на голос, кандидаты с опытом в следующих областях будут иметь значительное преимущество: Опыт работы с FreeSwitch или другими SIP/телефонийными платформами Интеграция TTS (ElevenLabs, Google TTS, Amazon Polly и др.) Интеграция ASR (Deepgram, Whisper, Google STT и др.) Оптимизация и ускорение работы моделей (квантование, дообучение, vLLM, ONNX, TensorRT) УСЛОВИЯ: Контракт напрямую с компанией Полная удалёнка, гибкий график Корпоративный ноутбук Доступ к передовым AI-инструментам и инфраструктуре Нерабочие дни по ТК РФ, оплачиваемы отпуск, больничные, sick daysПохожие вакансии