Обязанности:
Наша команда занимается разработкой и внедрением моделей машинного обучения для NLP/PLP/LLM и смежными задачами. ИИ для разработчиков, генерация кода, Fine-Tuning. Задачи команды: Улучшать и тестировать текущие модели с использованием SOTA или близких к ним подходов. Разрабатывать модели машинного обучения в области NLP/PLP и смежных задач. Развивать продукты по моделям-трансформерам. Модернизировать устаревшие сервисы, интегрировать с API входящих запросов. Строить пайплайны для моделей, подготавливать контейнеры. Обеспечивать эффективности на всех этапах: данные, архитектура, обучение, квантизация, фреймворки деплоя. Какой опыт и знания мы ожидаем: Опыт работы в области NLP от 3 лет. Высокий уровень математического аппарата - математический анализ, линейная алгебра, теория вероятностей. Детальное понимание моделей машинного обучения и алгоритмов. Высшее образование (IT, техническое). Уверенное владение языком Python 3.х, будет плюсом: ООП, паттерны, Web, Clean code. Знания Linux, bash, Docker. Знание classic ML/NLP - инструментов (numpy, pandas, sklearn, nltk, spacy, pymorphy, natasha, regex и др.); Опыт тюнинга моделей на различные задачи NLP (Question Answering, Code Search, Code Completion, Text Classification, POS Tagging, Machine Translation) и работы с эмбеддингами w2v, fastText, BERT, BM25 на PyTorch. Опыт вывода ML/NLP моделей в production (gradio/streamlit, fastapi/flask, FastChat, vLLM, CTranslate, Ray, OpenLLM и др.).