Обязанности:
Теги: genai, prompt engineering, llm api, rag, Python, SQL, Data Engineering, AI-агент О нашей команде:Команда занимается развитием и поддержкой корпоративного хранилища данных в Лаборатории Касперского. Cоздает ядро современной Customer Data Platform (CDP) — системы, предназначенной для сбора, унификации и обработки near real time больших объемов клиентских данных из различных источников данных (брокеры сообщений, реляционные БД, REST API). Сейчас мы расширяем сферу деятельности команды: помимо инженерии, мы начинаем активно внедрять AI. Мы ищем того, кто поможет нам грамотно выстроить процессы интеграции с LLM-платформой и внедрения AI-решений во внутренние сервисы компании.Вам предстоит: Full-cycle Development: Участие в полном цикле создания AI-продуктов — от генерации гипотез и быстрого прототипирования до промышленной эксплуатации и последующего мониторинга. Data Pipeline Engineering: Разработка end-to-end пайплайнов данных для AI-функций: организация сбора, нормализации, хранения, индексации и поиска информации. Интеграция в экосистему: Встраивание моделей и ML-сервисов в существующую ИТ-инфраструктуру, обеспечение бесшовной интеграции с продуктами, сервисами и внутренними источниками данных. Технологический стек: Определение оптимального стека технологий для разработки и эксплуатации (выбор библиотек, платформ, инструментов для обучения, тестирования и развертывания). Quality: Обеспечение высокого качества решений: контроль производительности, масштабируемости, надежности и безопасности систем. Оценка качества RAG/Агентов: Разработка и внедрение подходов к оценке RAG-систем и AI-агентов (точность, фактологичность, скорость ответа, стоимость инференса, автоматизированное и ручное тестирование, проверка гипотез и итеративное улучшение моделей и пайплайнов на основе данных). Мы ожидаем от Вас: Практический опыт разработки и вывода в production LLM-based решений (агенты, RAG, fine-tuning); Знание LLM-фреймворков (langchain, langgraph или аналоги) и подходов к разработке AI-агентов (function calling, structured output, context engineering); Хорошие навыки prompt/context engineering, опыт тестирования и регресспроверок промптов, понимание подходов к оценке llm-систем (offline-метрики, human evaluation, llm-as-a-judge, A/B тестирование); Знание ключевых ML-алгоритмов и библиотек (pytorch, scikit-learn, hugging face, etc), опыт их применения в продукте; Опыт разработки на Python (знание FastAPI или Litestar фреймворков); Хорошее знание SQL и опыт работы с реляционными СУБД (PostgresSQL/MS SQL Server); Опыт работы с векторными базами данных (Milvus/Qdrant/FAISS/pgvector) для RAGрешений; Опыт работы с большими объемами данных и оптимизации производительности; Опыт работы с Airflow и ETL-инструментами. Будет плюсом: Опыт разработки стриминговых пайплайнов; Опыт работы с Kafka; Опыт работы с Hadoop стеком (Spark, Hive); Опыт работы с Docker, Kubernetes; Опыт работы с Prometheus, Grafana. Что мы предлагаем: Сложные и интересные задачи, связанные с высокой нагрузкой и масштабированием; Возможность выстроить процессы с нуля; Расширение профессиональных компетенций в области AI; Современный стек технологий и рабочую среду, ориентированную на профессиональный рост; Развитие и карьерные перспективы в динамичной компании; Баланс между работой и личной жизнью.Похожие вакансии
Senior DevOps Engineer / Blockchain & AI Infrastructure Engineer
От 300 000 до 500 000 руб.
Москва. Станции метро: Водный стадион
Simplenight