other

AI/QA-инженер

19 июня 2026

З/П не указана

Город: Москва. Станции метро: ВДНХ, Алексеевская

Группа Rubytech

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

Обязанности:

Группа Rubytech — лидирующий производитель программно-аппаратных комплексов и разработчик технологий для высоконагруженных ИТ-инфраструктур. Мы выпускаем собственную линейку ПАК Скала^р, а также строим и защищаем от киберугроз инфраструктуру, обеспечивая бесперебойную работу крупного бизнеса и государственных организаций. Вам предстоит: Тестирования AI/ML-компонентов и сервисов; Проверка качества моделей и корректности вывода; Работа с фреймворками: LangChain, LlamaIndex, RAGAS, Langfuse; Тестирование агентских систем: проверка циклов (отсутствие зацикливания), корректность вызова инструментов, graceful degradation при ошибках; Настраивать тестовые датасеты с разнообразными сценариями (включая edge cases: сленг, опечатки, отрицания, длинные контексты); Создавать и поддерживать золотых датасетов (golden answers) для автоматической сверки; Вести тест-кейсы и чек-листы для регрессионного тестирования при смене модели или промпта; Тестировать RAG-пайплайны: качество retrieval (Hit Rate, MRR, NDCG@K), релевантность ответов, groundedness; A/B-тестирование промптов и моделей (включая сравнение разных LLM); Нагрузочное тестирование LLM-сервисов: измерение TTFT (time to first token), TPOT (time per output token), latency, throughput (инструменты: Locust, k6); Версионирование тестовых данных и датасетов (DVC или аналоги) для воспроизводимости тестов; CI/CD для ML: автоматический запуск тестов при изменении промпта, модели или коннектора; Мониторинг качества в продуктивном контуре: отслеживание дрифта метрик, аномалий в ответах, деградации retrieval. Требования к нашему кандидату: Опыт тестирования AI/ML-компонентов и сервисов; Опыт работы с фреймворками: LangChain, LlamaIndex, RAGAS, Langfuse; Опыт тестирования RAG-пайплайнов: качество retrieval (Hit Rate, MRR, NDCG@K), релевантность ответов, groundedness; Знание Python, SQL, REST API; Знание метрик оценки LLM; Понимание принципов работы агентских систем, MCP. Желательно: Опыт работы с Postman, Selenium, PyTest; Оценка экономической эффективности: контроль token usage, cost per request, API-лимитов; Понимание интеграционного тестирования: коннекторы к Active Directory, MS SharePoint, Confluence, мессенджерам и пр.; Навыки тестирования ИБ: prompt injection, jailbreak-атаки, проверка утечки PII (паспорта, телефоны), data leakage системных промптов. Что мы предлагаем: Уютный, комфортный и современный офис в пешей доступности от м. Алексеевская, где есть все необходимое для работы и даже больше: дежурный врач, кафе и столовая, кофе и фрукты, фитнес-центр, коворкинг и многое другое. Стабильный и «белый» конкурентный доход, который мы обсудим при встрече; Удобный график — гибрид или офис (в зависимости от подразделения); Работа в аккредитованной ИТ-компании из реестра Минцифры (отсрочка от мобилизации); Профессиональный рост, обучение и развитие, участие в проекте «Лекторий Rubytech»; Развитые спортивные комьюнити: футбол, волейбол, баскетбол и шахматы; ДМС для вас и вашей семьи на особых условиях; Тимбилдинги, митапы и другие корпоративные мероприятия; Скидки у 500+ партнеров (платформы BestBenefits и Lerna). Ждем вас в нашей команде!

Показать контакты

Имя не указано

Пожаловаться ID: 154993825

Похожие вакансии

QA инженер (AI)

Договорная

Москва. Станции метро: ВДНХ, Алексеевская

Рунити

QA-инженер (AI-агенты)

Договорная

Москва. Станции метро: ВДНХ, Алексеевская

СБЕР

QA AI Engineer (Python)

Договорная

Москва. Станции метро: ВДНХ, Алексеевская

Aston

Ведущий QA инженер (AI Coding Agent)

Договорная

Москва. Станции метро: ВДНХ, Алексеевская

СБЕР

Senior QA Automation Java (AI) инженер

Договорная

Москва. Станции метро: ВДНХ, Алексеевская

СБЕР

QA Инженер

Договорная

Москва. Станции метро: ВДНХ, Алексеевская

Сеть фитнес-клубов Spirit