other

Data Scientist (NLP / LLM)

Более недели назад

З/П не указана

Город: Москва. Станции метро: Римская, Площадь Ильича, Серп и Молот

Р-Вижн

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 1 года

Обязанности:

R-Vision – разработчик надежных систем цифровизации и кибербезопасности. С 2011 года мы создаем технологии, которые помогают организациям эффективно противостоять киберугрозам, поддерживать надежность ИТ‑инфраструктуры и обеспечивать цифровую трансформацию.Наши решения используются в крупнейших банках, государственных организациях, нефтегазовой отрасли, медиа, энергетике, металлургии, промышленности и в других сегментах бизнеса.Мы постоянно развиваем существующие продукты, разрабатываем новые сервисы и тщательно сопровождаем процесс интеграции наших решений в инфраструктуру клиентов. Благодаря командной работе и вкладу каждого сотрудника, нам удается достигать значимых результатов. О нашей команде: Управление технологий искусственного интеллекта и анализа данных — это R&D команда. Мы непрерывно исследуем передовые AI/ML подходы и трансформируем их в прикладные ИИ-сервисы (AI-агенты, RAG-системы, NLP-пайплайны), которые встраиваются в коммерческие продукты для защиты наших клиентов. Мы ищем именно прикладного исследователя, а не инженера инфраструктуры. У нас четко разделены роли: тебе не придется настраивать Kubernetes, поднимать Kafka или бороться с балансировщиками нагрузки — для этого есть выделенные MLOps и ML-инженеры. Твоя зона ответственности — это математика, данные, архитектуры моделей, формирование/проверка гипотез и математическое доказательство качества. Задачи: Оценка качества и контроль галлюцинаций (Evals): Разработка методологии оценки качества генерации и поиска (LLM-as-a-judge, фреймворки типа RAGAS/DeepEval), создание эталонных датасетов (Golden Datasets) для непрерывного тестирования. Развитие LLM и R&D: Подготовка данных и полный цикл дообучения открытых языковых моделей под специфику терминологии кибербеза. Формирование гипотез и проведение A/B тестирования различных архитектур. Разработка специализированных SLM (Small Language Models): Подготовка данных, дистилляция знаний и дообучение компактных моделей для перевода естественного языка в структурированные запросы (Text-to-RQL / Text-to-SQL). Построение логики RAG-систем: Проектирование архитектуры умного поиска (семантический чанкинг, гибридный поиск, Reranking) по корпоративным базам знаний, логам и инцидентам. NLP и извлечение сущностей (NER): Обучение легковесных моделей для анализа неструктурированных данных (например: отчеты Threat Intelligence) и автоматического извлечения индикаторов сущностей различных типов. Проектирование логики AI-агентов: Создание графов рассуждений (сценариев поведения), настройка Tool-calling и системных промптов для мультиагентных систем помощи аналитикам SOC. Работа с данными: Проведение разведочного анализа (EDA), очистка и разметка сложных массивов данных (в том числе сырых логов). Классическое машинное обучение: Применение классических алгоритмов машинного обучения для решения задач классификации/регрессии, где использование LLM избыточно Ожидаем от тебя: Уверенное владение Python (Pandas, NumPy, PyTorch) и умение писать оптимизированный код для проведения ML-экспериментов. Глубокое понимание архитектуры Transformer. Опыт оценки качества разрабатываемых систем машинного обучения (понимание метрик Recall@K, Precision, NDCG). Опыт решения задач NLP (NER, классификация текстов) с использованием BERT-подобных моделей или LLM. Уверенная работа с векторными БД и алгоритмами гибридного поиска. Практический опыт подготовки данных и полного цикла дообучения языковых моделей (как больших LLM через современные методы PEFT: LoRA, QLoRA, DoRA, так и узкоспециализированных SLM для задач структурированной генерации формата JSON/RQL). Сильная математическая база, понимание статистики и знание классических ML-алгоритмов. Высшее профильное образование (Искусственный интеллект / Машинное обучение / Математика / Компьютерные науки). Будет плюсом: Понимание предметной области информационной безопасности. Практический опыт проектирования графов состояний и логики для AI-агентов (LangGraph или аналоги). Мы предлагаем: Удаленный формат работы; Достойную оплату труда, соответствующую профессиональному уровню и компетенциям; Статус аккредитованной ИТ-компании со всеми преимуществами; ДМС со стоматологией и госпитализацией по всей России, страхование от несчастного случая, полис ВЗР для поездок за границу, ветеринарная поддержка; 100% компенсацию больничного, +10 дополнительных дней в году на отгул по болезни; Регулярный обмен обратной связью по системе полугодового Performance Review; Возможности для обучения и профессионального развития: корпоративную библиотеку, менторство, внутренние митапы по обмену опытом, практику публичных выступлений, возможность участвовать в создании контента для профессиональных сообществ; Программу корпоративных скидок и привилегий; Развитую корпоративную культуру: открытую коммуникацию, онлайн и офлайн встречи, клубы по интересам, спортивные активности и поддержку инициатив сотрудников. Несмотря на быстрый рост, мы основательно подходим к подбору специалистов, поэтому нам удалось собрать профессиональную и сплоченную команду. Присоединяйся к нам!

Показать контакты

Имя не указано

Пожаловаться ID: 154412213

Похожие вакансии

Data Scientist (NLP/ LLM)

Договорная

Москва. Станции метро: Римская, Площадь Ильича, Серп и Молот

ФГАОУ ВО МГТУ им. Н.Э. Баумана

NLP Data Scientist Преподаватель NLP/LLM

Договорная

Москва. Станции метро: Римская, Площадь Ильича, Серп и Молот

Низов Александр Сергеевич

Data Scientist (LLM)

Договорная

Москва. Станции метро: Римская, Площадь Ильича, Серп и Молот

YADRO

Data scientist (NLP) middle

От 225 000 до 250 000 руб.

Москва. Станции метро: Римская, Площадь Ильича, Серп и Молот

Платформа ОФД

NLP Data Scientist Junior+

Договорная

Москва. Станции метро: Римская, Площадь Ильича, Серп и Молот

Альфа-Банк

Data Scientist NLP (Senior)

Договорная

Москва. Станции метро: Римская, Площадь Ильича, Серп и Молот

СБЕР