Обязанности:
Вакансия компании: ООО "КОМБЛОК" О проекте Разработка экосистемы сервисов на базе ИИ для автоматизированного анализа контента и аудитории в мессенджерах. Реализация RAG/LoRA и open source LLM для обработки TG-контента, семантического анализа, предсказаний, генерации контента и ИИ-отчетов. Мы предлагаем: Конкурентоспособная заработная плата, 2 раза в месяц по 50% или 1 раз в месяц, согласовывается с сотрудником. График работы: 5/2. На старте - только работа в офисе (1-2 месяца), далее есть возможность рассмотреть гибридный график работы. Дружелюбная атмосфера и мотивированная команда профессионалов Возможность профессионального роста и обучения. Обязательные требования Python (FastAPI, Pydantic) для ML-сервисов и API. RAG-пайплайны с векторными БД (PGVector, FAISS). LoRA/PEFT для fine-tuning open source LLM (Llama, Mistral, Qwen). Развертывание моделей (Docker, vLLM, TGI, ONNX Runtime) на GPU/CPU. Асинхронные запросы (asyncio, aiohttp), батчинг для оптимизации нагрузки и latency. Обработка больших данных: векторизация текста (Sentence Transformers), эмбеддинги. Интеграция с бэкендом (Postgres, Redis, очереди Celery/RQ) и мониторинг (Prometheus). Желательные навыки Опыт анализа контента (NLP на русском, тематическое моделирование). Оптимизация инференса (квантизация GGUF, Flash Attention, multi-GPU). MLOps: CI/CD для моделей (GitHub Actions), A/B-тесты, drift-мониторинг. Fine-tuning open source LLM на доменных данных (TG-статистика, аудитория). Интеграция с парсерами (Telethon/Playwright) для real-time данных. NLP: NER, sentiment analysis, topic modeling (BERT, T5). Требуемый опыт Не менее 3 лет в ML engineering (LLM, RAG, deployment). Проекты с production ML . Работа в команде (Git, code review, Agile). Деплой и поддержка высоконагруженных ML-сервисов.Похожие вакансии