Обязанности:
Компания KVINT – ведущая компания по разработке и внедрению голосовых роботов/виртуальных ассистентов. Основной продукт – голосовые виртуальные ассистенты, способные заменить живого человека на телефоне на входящих и исходящих звонках, во время которых роботы полностью имитируют живое человеческое общение по телефону, и люди не догадываются, что общаются с роботом.Решение построено на нейронных моделях, содержит технологии синтеза и распознавания речи, обработки естественного языка и управления диалогом.Мы ищем человека, который хочет принимать участие в создании крупного и интересного проекта, обладает высокой квалификацией и готов работать в команде. Если вы уверены в своих способностях и ищете новые вызовы, мы будем рады видеть вас в нашей команде! Основные задачи:— Разработка и оптимизация моделей LLM для голосовых ассистентов, включая fine-tuning opensource LLM для обработки звонков на русском языке, с адаптацией моделей под специфические особенности телефонного домена.— Подбор и дообучение моделей LLM для оптимального использования ресурсов, улучшения производительности и точности инференса.— Проведение стресс-тестирования моделей для гарантии надежности и производительности в высоконагруженной среде.— Разработка и интеграция решений по созданию и обновлению базы знаний на основе документов различных типов, с прицелом на телефонные сценарии. Требования: — Уверенные знания Python (Data Science), PyTorch, Docker— Опыт работы с LLM (prompt engineering, fine-tuning)— Глубокое понимание DL и NLP для работы с текстовыми данными— Опыт работы с векторными базами данных— Желателен опыт в дистилляции и прунинге нейронных сетей— Желателен опыт работы с Nvidia Triton Server Условия: Независимость и самостоятельность в реализации задач, поощрение инициативы, гибкий менеджмент и отсутствие бюрократии Работа в команде профессионалов, обучение в рамках предметной области Крупный перспективный проект федерального масштаба с возможностями для профессионального развития Конкурентная заработная плата Возможность работать на полной удаленке Интересные задачи и самые современные технологии Зарплатные ожидания обсуждаются на собеседовании и всегда принимаются во внимание при оффере