other

Data scientist (NLP)

19 ноября 2024

З/П не указана

Город: Москва. Станции метро: Спортивная, Лужники

Платформа ОФД

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 1 года

Обязанности:

Платформа ОФД - продуктовая IT- компания, крупнейший в России оператор фискальных данных. № 1 в рейтинге ОФД по данным CNews, резидент Сколково. Мы анализируем рынок российского ритейла на данных из чеков в режиме реального времени. Ежедневно мы обрабатываем 60 млн кассовых чеков - каждый 3-й чек, пробиваемый в России. В нашей базе 2 млрд уникальных названий товаров. Мы предлагаем условия: Комфортный офис с relax зоной близко от м. Спортивная / МЦК Лужники График работы гибридный: офис 1-2 раза в неделю. Гибкое время начала рабочего дня Трудоустройство по ТК РФ, белая заработная плата ДМС, включая госпитализацию, скорую и стоматологию Насыщенную корпоративную жизнь Обучение и семинары за счет компании Скидки от партнеров, льготная ипотека от Сбера Наша команда DS занимаются следующим: - Классические задачи: классификация/тематическое моделирование, NER, NEL, задачи поиска. Все не так просто, так как объемы большие, данные сильно вариативны - Нестандартные задачи: кластеризация / “как объединитьмагазины в полигоны по три, используя нечеткий спуск по графу” / “как отсортировать данные, чтобы ускорить разметку” / “как мэтчить млрд-ы id-шников по timestamp и total_sum”Почему у нас может быть интересно/полезно? • Cовременный стек, можно много чему научитьсяЧетко сформулированные задачи и метрики оценивания моделей • Развитая инфраструктура: есть несколько кластеров Hadoop, у DS естьнесколько мощных машин, GPU делают бр-бр • Некоторые задачи, действительно крутые, например, мы обучаем LLM-ы и всегда держим нос по ветру в плане SOTA(у нас хватает и данных, и ресурсов, т.к тексты короткие) • Нужно делать мало sql и немного уметь в Spark (или очень хотеть научиться) Стек, который мы используем:linux, git, bash(DS стек): jupyterhub, python, стандартный python стек (pandas, numpy, sklearn, matplolib, …), fasttext, torch, HuggingFace, transformers, BERT, LLM, MlFlow, Hadoop, Spark, Hive, Zeppelin/IntelliJ, AirFlow Откликайся, если ты: Работаешь в качестве DS от года Знаешь Python и части DS стека Пишешь красивый код Понимаешь, как устроены модели Имеешь в/о Будет плюсом, если ты: работаешь в DL и умеешь читать статьи имеешь опыт в классическом машинном обучении и практический опыт решения задач NLP знаешь, как работать в Zeppelin умеешь в Spark или очень хочешь научиться Как проходит найм: Техническое интервью с TL команды DS Опционально: тестовое задание на дом или live coding во время тех.интервью Уровень дохода готовы обсуждать с успешными кандидатами

Имя не указано

Откликнуться
Разместить Резюме
Пожаловаться ID: 124502603

Похожие вакансии

NLP Data Scientist

До 450 000 руб.

Москва. Станции метро: Спортивная, Лужники

Точка

Data Scientist NLP

Договорная

Москва. Станции метро: Спортивная, Лужники

СБЕР

Data Scientist (NLP/LLM)

Договорная

Москва. Станции метро: Спортивная, Лужники

ФИНАМ

Senior Data Scientist (NLP)

Договорная

Москва. Станции метро: Спортивная, Лужники

Цифровые технологии и платформы

TeamLead Data Scientist (NLP)

До 550 000 руб.

Москва. Станции метро: Спортивная, Лужники

Точка

Data scientist NLP (middle+)

Договорная

Москва. Станции метро: Спортивная, Лужники

Ростелеком