Обязанности:
Привет! На связи команда Университета Иннополис. Мы представляем вуз, который не только готовит ИТ-специалистов, но и реализует крупные коммерческие и грантовые проекты в партнёрстве с 400 российскими и международными компаниями. В университете — 1000+ сотрудников из 20 стран, 1500+ студентов из 32 стран, 538 завершённых проектов, действуют Исследовательский центр в сфере ИИ, Центр развития промышленной робототехники, Передовая инженерная школа, стартап-студия, 19 научно-исследовательских лабораторий и другие. На данный момент мы ищем Middle/Senior ML-инженер по обработке естественного языка (NLP+LLM) в Институт искусственного интеллекта) Задачи, которые предстоит решать: Быстрое создание демок для пресейлов (вместе с бэкендерами и аналитиками); Обработка данных, включая генерацию синтетических датасетов; В перспективе - оптимизация разработанных моделей (в некоторых проектах инференс без GPU в проде); Выбор оптимального тех. решения для решения задачи – понимание соотношения ресурсы/качество и в каких случаях чем можно пожертвовать; Генерация гипотез и их проверка; Проектирование ML-решений с нуля: от постановки задачи, выбора архитектуры модели (включая подбор слоёв, loss-функций, стратегий обучения) до production-ready реализации; Реализация и обучение кастомных моделей (не AutoML / не pipeline-only решения); Файнтюнинг, дообучение и адаптация transformer-моделей под конкретные домены и ограничения; Разработка и поддержка полного ML-pipeline: данные → обучение → валидация → инференс → мониторинг; Деплой моделей в продакшн (Docker / K8s), оптимизация инференса (CPU-only, latency, memory); Выбор и обоснование компромиссов между качеством, ресурсами и скоростью разработки; Генерация и проверка гипотез на основе экспериментов, а не только prompt-итераций. Что нужно, чтобы стать частью команды: Глубокое понимание машинного обучения и математических основ на уровне самостоятельной реализации моделей; Практический опыт разработки ML/NLP-моделей с нуля: написание кастомных PyTorch-моделей, реализация собственных training / inference loop; Опыт реализации архитектур из научных статей (arXiv, ACL, EMNLP и т.п.), а не только использования готовых библиотек; Уверенная работа с PyTorch: torch.nn, autograd, кастомные loss-функции, оптимизаторы, scheduler’ы; Опыт работы с LLM на уровне модели, а не только API: fine-tuning / adapters / LoRA / PEFT, архитектурные паттерны RAG, tool-calling, agents, понимание ограничений LLM (hallucinations, bias, context window, cost); Понимание различий между: prompt-engineering, model-engineering, system-level ML-design; Опыт работы с ML-библиотеками и библиотеками для работы с данными (Pandas, NumPy, Scikit Learn, CatBoost, XGBoost, LightGBM, PyTorch и др.); Умение обосновано выбирать и считать метрики; Определять полноту и валидировать данные. Будет плюсом опыт работы с: Опыт оптимизации моделей (quantization, pruning, distillation); Опыт работы с ограниченными ресурсами (CPU-only inference, low-latency системы); инструментами MLOps: ClearML, LangFuse и т.п.; Visual transformers; OCR. Почему именно МЫ? Мы ценим каждого члена нашей команды и соблюдаем work-life баланс. Что мы готовы тебе предложить: Комфортные условия (отсутствие дресс-кода, никаких галстуков и пиджаков, столовые, места для отдыха, комфортное рабочее место в г.Иннополис либо дистанционный формат работы; Интересная корпоративная жизнь; Обучение и поддержка, дружественная атмосфера, клубы по интересам; Официальное трудоустройство по ТК РФ; График работы с 9 до 18, пятница сокращенный рабочий день; Бесплатный трансфер Казань-Иннополис-Казань. Но это еще не все!ДМС. Корпоративный полис добровольного медицинского страхования. Фитнес. Корпоративная скидка на посещение фитнес-клуба Иннополиса. Образование. Доступ к интересным лекциям университета и корпоративной библиотеке. Интересно? Тогда поехали! Оставляй свой отклик и получи обратную связь от наших специалистов.Похожие вакансии