other

Senior AI/ML-инженер (Python)

Более недели назад

З/П не указана

Город: Казань

Технократия

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 6 лет

Обязанности:

Мы создаём финтех-продукты для рынков, где формируется будущее финансовых технологий. Работаем на международных проектах, совмещая скорость стартапов с надёжностью enterprise-разработки. У нас прозрачные процессы, честные грейды и инженерная культура без бюрократии. У нас можно создавать международный финтех, влиять на продукт и расти в предсказуемой, честной и зрелой инженерной среде. Прямо сейчас мы в поиске AI/ML-инженера. Стек технологий: Python 3.12+, asyncio, FastAPI, Uvicorn, Pydantic v2, LiteLLM, vLLM, TGI, Ollama, LangChain, LlamaIndex, Qdrant, Chroma, Pinecone, Sentence-Transformers, OpenAI Embeddings, Unstructured, Chonkie, LangChain Text Splitters, FlashRank, Cohere, Presidio, NeMo Guardrails, Detoxify, OpenLLMetry, LangFuse, LangSmith, Prometheus, Docker, Kubernetes, CUDA, GPU, A10, A100, MinIO. Чем предстоит заниматься? Разрабатывать LLM routing и gateway слой; Реализовывать и оптимизировать RAG-пайплайны; Встраивать guardrails и AI safety механизмы; Интегрировать LLM observability и трейсинг; Оптимизировать inference по latency, throughput и стоимости; Реализовывать evaluation-пайплайны качества ответов; Работать с GPU-инфраструктурой и масштабированием. Мы ожидаем от Вас: Опыт работы от 5 лет; Реальный опыт вывода ML-моделей в production и понимание жизненного цикла модели; Глубокое понимание RAG-архитектур: практические навыки работы с векторными БД (Qdrant, Milvus, Weaviate, PGVector) и фреймворками (LangChain, LlamaIndex или кастомные решения); Глубокое знание Python и async-стека; Умение проектировать и оценивать эксперименты, работать с метриками​​​; Продуктовый опыт работы с LLM; Понимание рисков и безопасности LLM-систем. Будет плюсом: Agentic RAG и multi-agent системы; Fine-tuning моделей (LoRA, QLoRA); Multi-modal модели (vision, audio); ASR, TTS, OCR, NER; Опыт evaluation-фреймворков (RAGAS, deepeval); Оптимизация inference (batching, KV-cache, quantization). Почему мы?​​​​​​ График 5/2 по календарю РФ, гибкое начало рабочего дня до 10:00 по Московскому времени; Уютный офис в центре Казани, возможность удаленной работы из других город; Официальное трудоустройство в аккредитованной IT-компании со всеми плюшками; Корпоративные уроки английского, фитнес прямо в офисе, футбольная команда, библиотека и партнёрские бенефиты; Подарки к праздникам и здоровую атмосферу, где твой вклад ценят; Поддержка профессионального развития — участие в конференциях, обучение, обмен опытом; Открытая культура и высокий уровень доверия.

Показать контакты

Имя не указано

Пожаловаться ID: 151026803

Похожие вакансии

Middle+ / Senior ML-инженер

От 260 000 руб.

Казань

RedLab

Senior Data Scientist / ML разработчик

Договорная

Казань

Гудфокаст

AI / LLM Automation Engineer (Python)

Договорная

Казань

Маджестик

Senior QA automation Python specialist

Договорная

Казань

Maxim technology

ML-инженер (Инфопанель)

Договорная

Казань

СБЕР

ML-инженер (Инфопанель)

Договорная

Казань

СБЕР