Обязанности:
DataOffice - это драйвер DataDriven культуры в Ростелекоме, один из лидеров отрасли управления данными в России. DataOffice объединяет 300 профессионалов в области ИТ-технологий. В компании расширяется команда для разработки сервисов на базе больших языковых моделей: прикладные настольные приложения для повышения эффективности сотрудников и внедрение ИИ в программные продукты РТК (Яга/Ежка, аналоги Jira/Trello/Confluence, ITSM и т.д.). Примеры сервисов: Виртуальный помощник на базе LLM; Генерация формального текста или шаблона задачи из свободного описания; Формирование саммари текстов; Построение RAG систем по документам, базам данных; Интеллектуальная нарезка историй и задач на подзадачи или пункты и выделение именованных сущностей из них. Что мы ожидаем от кандидата: Опыт работы в роли Data scientist от 2 лет; Работа с одним из фреймворков PyTorch/TensorFlow; Знание основных подходов для предобработки и векторизации текста; Наличие опыта решения задач NLP для текста (Text Classification, NER, Text Summarization); Знакомство и понимание основных принципов современных SOTA моделей NLP; Владение: git, docker, sql и одним из фреймворков для реализации api. Будет плюсом: Участие в соревнованиях по ML/DL; Практический опыт до обучения и работы с open source LLM; Публикации по NLP; Собственные проекты по NLP. Мы предлагаем: Работа в крупнейшем в России интегрированном провайдере цифровых решений; Возможна полная или частичная удаленная работа из России; В Москве - БЦ Академик, победивший в номинации лучший проект «Бизнес-центр класса А. Москва» Возможность работать из офисов в городе Краснодар и Новосибирск. Официальное оформление — согласно ТК РФ (полный соц. пакет: ежегодный оплачиваемый отпуск 28 календарных дней, оплата больничных); Официальная заработная плата (оклад и годовая премия); Кафетерий льгот с 1 рабочего дня: ДМС, компенсация транспорта, интернета, спорта, обучения и др.; Корпоративное обучение: внутренние митапы, участие в конференциях, доступ к корпоративным библиотекам технической и бизнес литературы.