other

AI Engineer

Более недели назад

З/П не указана

Город: Москва

ФосАгро

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

Обязанности: Разработка production NLP/LLM-решений: поиск, классификация, извлечение, суммаризация, Q&A/ассистенты. Проектирование агентских и неагентских LLM-пайплайнов: tool/function calling, маршрутизация, контракты инструментов, обработка ошибок, управление контекстом/состоянием. Реализация knowledge Q&A / RAG: подготовка данных, индекс/поиск, эмбеддинги, reranking, grounding/цитирование, контроль качества. Интеграция в корпоративную среду: сервисы и API, внутренние API/БД, очереди/воркеры, фоновые задачи. Эксплуатация и улучшение: логи/метрики/трейсы, диагностика, регрессии качества/производительности. Оптимизация инференса: latency/throughput, лимиты/контекст, кэширование/батчинг, квантование. Опционально: адаптация под домен (PEFT/LoRA/QLoRA) с оценкой Требования: Образование: высшее техническое / ИТ. Опыт: 3–5 лет разработки и поддержки production-сервисов в области NLP/LLM. LLM в проде: понимание токенизации/контекста и ограничений, типовых failure-modes; понимание, когда уместна адаптация модели (PEFT/LoRA/QLoRA) и как оценивать влияние на качество/производительность. RAG / knowledge Q&A: практический опыт построения решений на базе корпоративных данных: эмбеддинги, retrieval (векторный/гибридный), reranking, grounding/цитирование, контроль качества. Инструменты LLM: HuggingFace + LangChain/LlamaIndex (или аналоги); опыт построения agentic/non-agentic пайплайнов с tool/function calling (контракты инструментов, устойчивость вызовов). Backend и интеграции: сильный Python; сервисы и API (FastAPI или аналоги), очереди/воркеры/фоновые задачи, интеграции с внутренними системами; тесты и сопровождение. Production/observability: логи/метрики/трейсы (Grafana/Prometheus или аналоги), диагностика инцидентов и деградаций качества/производительности. Инфраструктура: Linux/CLI; Kubernetes на уровне чтения манифестов/логов и участия в диагностике. Будет Плюсом: Langfuse или аналоги (on-prem): трассировка/метрики/eval. LiteLLM или аналоги: gateway/router, маршрутизация, лимиты. OpenWebUI или аналоги: интеграция с retrieval/RAG и логированием. Workflow orchestration: Temporal / Airflow / Prefect / Dagster / Argo; принципы идемпотентности, ретраев/таймаутов, зависимостей шагов, long-running процессов, сигналов/HITL, наблюдаемости выполнения. MCP (Model Context Protocol): подключение инструментов по протоколу, контракт инструментов, безопасность/изоляция, наблюдаемость вызовов. Self-hosted inference/serving: vLLM / TGI / Triton или аналоги; оптимизации GPU-инференса. Условия: Удалённый формат работы Официальное оформление по ТкРФ, белая ЗП по результатам технического собеседования; График работы 5/2 с 8:30 до 17:30 по Москве; Премии за эффективную работу и достижение результатов; Различные программы обучения для прокачки профессиональных скиллов; ДМС программа

Показать контакты

Имя не указано

Пожаловаться ID: 152468747

Похожие вакансии

AI Engineer

Договорная

Москва

Брайт Эйдженси

AI Engineer

Договорная

Москва

АО «ОТП Банк» (JSC «OTP Bank»)

AI Engineer

Договорная

Москва

АО «ОТП Банк» (JSC «OTP Bank»)

AI Engineer

Договорная

Москва

Мосгосэкспертиза

AI Engineer (Product Engineer, AI-Driven Development)

От 250 000 до 300 000 руб.

Москва

Production IT

Senior AI engineer

Договорная

Москва

АО «ОТП Банк» (JSC «OTP Bank»)