Мы разрабатываем LegalTech-продукты на основе передовых NLP-моделей. Наши решения ежедневно анализируют сотни типов юридических документов, извлекают из них знания и помогают людям принимать с их помощью ответственные решения. Это позволяет оптимизировать работу банка по правовым рискам кредитных сделок с минимальным участием человека. Обязанности — Решение сложных задач по созданию разнообразных AI-сервисов в юридической сфере с использованием LLM GigaChat; — Исследование и подбор передовых решений, быстрая оценка их эффективности, оценка необходимых ресурсов (данные, вычисления), проверка гипотез, разработка плана разработки; — Формирование требований к разметке: вопросов-ответов и чатов для задачи дообучения LLM на специализированном юридическом домене, взаимодействие с юристами и специалистами по разметке; — Повышение качества генерации LLM за счет использования продвинутых техник промтинга (CoT, ToT, ReAct, Planning, etc); — Создание собственных AI-агентов, решающих юридические задачи шаг за шагом; — Участие в создании специализированного юридического бенчмарка для оценки способностей LLM; — Желание разобраться в нюансах нашей доменной области. Требования — Опыт разработки NLP-моделей от 3-х лет; — Знание передовых подходов, умение объяснить их команде; — Отличное знание основ Data Science — от линейной алгебры и теории вероятностей до DNN и RLHF; — Понимание архитектуры и принципов устройства и обучения больших лингвистических моделей (LLM) и генеративных трансформеров типа GPT/Bert; — Понимание принципов обучения и применения моделей обучения с подкреплением (Reinforced Learning); — Понимание основных методов Machine Learning (regressions, clustering, decision trees, и т.д.), уверенное знание когда их применять, а когда не надо; — Оценка вычислительной сложности всего Pipeline, применение классических алгоритмов для её снижения; — Готовность браться за нестандартные, сложные задачи; — Быстро проверять гипотезы на небольших мощностях и масштабировать успешные решения; — Умение оценивать прогресс решения на цифрах; — Готовность работать в команде и применять Git, Jira, Confluence и другие средства командной работы; — Высокая степень самоорганизации. Условия — Страшно интересные NLP задачи в самой сложной области предметных знаний (GPT + Legal domain); — Возможность обучения и развития, участия в конференциях от Сбера; — Уютный офис с печеньем и другими удобствами; — Социальный пакет (ДМС, фитнес, льготное страхование).