other

Data scientist (NLP)

18 сентября 2024

От 170 000 до 200 000 руб.

Город: Москва. Станции метро: Спортивная, Лужники

Платформа ОФД

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 1 года

Обязанности:

Платформа ОФД - продуктовая IT- компания, крупнейший в России оператор фискальных данных. № 1 в рейтинге ОФД по данным CNews, резидент Сколково. Мы анализируем рынок российского ритейла на данных из чеков в режиме реального времени. Ежедневно мы обрабатываем 60 млн кассовых чеков - каждый 3-й чек, пробиваемый в России. В нашей базе 2 млрд уникальных названий товаров. Мы предлагаем условия: Комфортный офис с relax зоной близко от м. Спортивная / МЦК Лужники График работы гибридный: офис 1-2 раза в неделю. Гибкое время начала рабочего дня Трудоустройство по ТК РФ, белая заработная плата ДМС, включая стоматологию, госпитализацию и скорую Насыщенную корпоративную жизнь Обучение и семинары за счет компании Скидки от партнеров, льготная ипотека от Сбера Наша команда DS занимаются следующим: - Классические задачи: классификация/тематическое моделирование, NER, NEL, задачи поиска. Все не так просто, так как объемы большие, данные сильно вариативны - Нестандартные задачи: кластеризация / “как объединитьмагазины в полигоны по три, используя нечеткий спуск по графу” / “как отсортировать данные, чтобы ускорить разметку” / “как матчить млрд-ы id-шников по timestamp и total_sum”Почему у нас может быть интересно/полезно? • Cовременный стек, можно много чему научитьсяЧетко сформулированные задачи и метрики оценивания моделейКомфортная атмосфера • Развитая инфраструктура: есть несколько кластеров Hadoop, у DS естьнесколько мощных машин, GPU делают бр-бр • Некоторые задачи, действительно крутые, например, мы обучаем LLM-ы и всегда держим нос по ветру в плане SOTA(у нас хватает и данных, и ресурсов, т.к тексты короткие) • Нужно делать мало sql и немного уметь в Spark (или очень хотеть научиться) Стек, который мы используем:linux, git, bash(DS стек): jupyterhub, python, стандартный python стек (pandas, numpy, sklearn, matplolib, …), fasttext, torch, HuggingFace, transformers, BERT, LLM, MlFlow, Hadoop, Spark, Hive, Zeppelin/IntelliJ, AirFlow Откликайся, если ты: Работаешь в качестве DS от года Знаешь Python и части DS стека Пишешь красивый код Понимаешь, как устроены модели Имеешь в/о или обучаешься на последнем курсе вуза Будет плюсом, если ты: работаешь в DL и умеешь читать статьи имеешь опыт в классическом машинном обучении и практический опыт решения задач NLP знаешь, как работать в Zeppelin умеешь в Spark или очень хотеть научиться

Имя не указано

Откликнуться
Разместить Резюме
Пожаловаться ID: 122270725

Похожие вакансии

Data scientist NLP

Договорная

Москва. Станции метро: Спортивная, Лужники

Recruitment Boutique S.M.Art

NLP Data Scientist

До 450 000 руб.

Москва. Станции метро: Спортивная, Лужники

Точка

Data Scientist NLP

Договорная

Москва. Станции метро: Спортивная, Лужники

СБЕР

Middle NLP Data Scientist

Договорная

Москва. Станции метро: Спортивная, Лужники

Сбербанк России, ПАО

Senior Data Scientist (NLP)

Договорная

Москва. Станции метро: Спортивная, Лужники

Цифровые технологии и платформы

Senior Data Scientist (NLP)

Договорная

Москва. Станции метро: Спортивная, Лужники

СБЕР