Федеральное государственное бюджетное учреждение запускает стратегический проект по созданию собственной языковой модели (LLM) для внутреннего использования. Модель будет разрабатываться с нуля под закрытым контуром организации – от выбора архитектуры и платформы до программирования, обучения и внедрения в рабочие процессы. Мы ищем ключевого специалиста, который возьмёт на себя полный технический цикл и сформирует ИИ-направление внутри учреждения. Обязанности: провести анализ потребностей и определить оптимальную стратегию: обучение модели с нуля или глубокая адаптация открытых решений под закрытый контур; сформировать с нуля и возглавить команду, распределить зоны ответственности между ML-инженерами, дата-инженерами и DevOps; спроектировать архитектуру LLM, выбрать стек технологий, фреймворки и вычислительную платформу (on-premise или доверенная облачная среда) с учётом ограничений бюджетной организации и требований информационной безопасности; организовать полный цикл работы с данными: сбор, очистка, фильтрация, токенизация и разметка корпуса внутренних текстов с соблюдением законодательства о персональных данных и государственной тайны; обучить, валидировать и оптимизировать модель под ключевые бизнес-задачи (генерация документов, смысловой поиск, вопросно-ответные системы, классификация, суммаризация); развернуть LLM в продуктивном закрытом контуре, обеспечить стабильность и безопасность инференса, реализовать API для интеграции с внутренними информационными системами. Требования: подтверждённый успешный опыт создания языковой модели с нуля (предобучение или глубокая адаптация под закрытый контур) с измеримым результатом: в резюме или портфолио должна быть раскрыта ваша роль и достигнутые показатели; глубокое знание архитектур трансформеров (GPT, BERT, LLaMA и т.п.), опыт работы с PyTorch/TensorFlow, Hugging Face Transformers, библиотеками распределённого обучения (DeepSpeed, Megatron-LM и аналогами); практический опыт подготовки и препроцессинга крупных текстовых массивов для обучения LLM; уверенное программирование на Python; знание C++ будет весомым плюсом; понимание методов оптимизации инференса (квантование, ONNX, TensorRT, vLLM и др.) и требований промышленной эксплуатации, включая мониторинг и отказоустойчивость; высшее техническое или математическое образование; готовность к работе с данными ограниченного доступа, понимание требований 152-ФЗ и нормативов ФСТЭК России (или готовность их оперативно изучить). Будет плюсом: наличие собственной готовой команды (ML-инженеры, дата-инженеры, DevOps), способной включиться в проект в ближайшее время; опыт построения ИИ-систем в государственных структурах, научных институтах или режимных организациях; знание специфики российских вычислительных платформ и облачных провайдеров (Yandex Cloud, VK Cloud, on-premise GPU-фермы); опыт внедрения LLM в контуре, изолированном от сети Интернет, и опыт прохождения аттестации информационных систем. Условия работы: работа в комфортном офисе в центре Москвы (2 минуты пешком от м. Семеновская), возможен гибридный формат работы; оформление согласно ТК РФ; уровень заработной платы зависит от уровня должности, квалификации кандидата и обсуждается на финальном собеседовании с успешным кандидатом; полная занятость, рабочий день с 9.00. до 18.00., в пятницу до 16.45. отпуск 28 календарных дней+4 дня дополнительно; масштабная и интеллектуально амбициозная задача: создание языковой модели с нуля, которой будут пользоваться реальные подразделения учреждения; высокая степень самостоятельности в выборе архитектуры, платформы и инструментов; возможность собрать под себя команду и выстроить долгосрочное ИИ-направление.
Похожие вакансии
Руководитель направления коммерциализации ИИ
Договорная
Москва. Станции метро: Электрозаводская, Семеновская
Дом.ру
Руководитель направления коммерциализации ИИ-решений
Договорная
Москва. Станции метро: Электрозаводская, Семеновская
Дом.ру
Руководитель направления (Стратегия ИИ решений)
Договорная
Москва. Станции метро: Электрозаводская, Семеновская
RWB (Wildberries & Russ)
Руководитель направления по ИИ-трансформации клиентов
Договорная
Москва. Станции метро: Электрозаводская, Семеновская
СБЕР
Руководитель разработки ИИ-продуктов
Договорная
Москва. Станции метро: Электрозаводская, Семеновская
DOGMA