Обязанности: разработка, настройка и поддержка LLM-решений: fine-tuning (с использованием Unsloth/LoRA), построение RAG- и агентных систем; развертывание и мониторинг inference-сервисов, оптимизация производительности и стоимости (кеширование, управление контекстом, rate limiting); обеспечение безопасности: защита от prompt injection, соблюдение data governance и установка policy guardrails; ведение экспериментов с воспроизводимостью (MLflow), написание тестов (unit, golden, fuzzing), участие в CI/CD, документирование и соблюдение best practices. Требования: опыт интеграции OpenAI API, проектирования устойчивых промптов, построения RAG- и агентных систем, работа с векторными базами данных, data ingestion, fine-tuning; уверенное применение MLOps-практик: управление экспериментами (MLflow), CI/CD для моделей, мониторинг в продакшене, тестирование (golden tests, fuzzing промптов); навыки разработки в JupyterLab, интеграции с backend-сервисами; свободное владение английским и китайским языками. Условия: релокация в Республику Татарстан; конкурентный уровень з/п; дневная рабочая неделя (ненормированная); транспорт до работы из г. Елабуга, г. Набережные Челны, г. Менделеевск, г. Нижнекамск; работа в крупной и стабильной компании – в структуре самой большой ОЭЗ в Европе.
Похожие вакансии