Обязанности:
Ищем data scientist в команду, комбинирующую применение бизнес-логики, классических моделей, NLP и LLM. Основные задачи команды: Проведение исследований, проверка гипотез команды с использованием LLM. Совершенствование LLM моделей, используя промт-инжиниринг. Векторизация документов (для RAG сервиса). Преобразование изображения текста в машиночитаемый формат(OCR). Разработка и внедрение моделей(NLP\классический ML\графовые сети) в промышленные системы. Поиск и обработка данных, создание эмбеддингов, внедрение в текущие процессы. Требования: Высшее математическое/техническое образование Понимание принципов работы с LLM Уверенное знание математики, статистики и машинного обучения; Владение Python и опыт практического применения алгоритмов машинного обучения: нейронные сети, композиционные алгоритмы, NLP. Уверенное владение SQL(оконные функции, регулярные выражения). Будет плюсом: Опыт работы с Hadoop(HDFS, Hive/Impala), Spark. Опыт работы с нейронными сетями на последовательностях.