other

Data scientist (NLP)

16 декабря 2024

От 150 000 руб.

Город: Москва. Станции метро: Спортивная, Лужники

Платформа ОФД

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 1 года

Обязанности:

Платформа ОФД - продуктовая IT- компания, крупнейший в России оператор фискальных данных. № 1 в рейтинге ОФД по данным CNews, резидент Сколково. Мы анализируем рынок российского ритейла на данных из чеков в режиме реального времени. Ежедневно мы обрабатываем 60 млн кассовых чеков - каждый 3-й чек, пробиваемый в России. В нашей базе 2 млрд уникальных названий товаров. Мы предлагаем условия: Комфортный офис с relax зоной близко от м. Спортивная / МЦК Лужники График работы гибридный: офис 1-2 раза в неделю. Гибкое время начала рабочего дня Трудоустройство по ТК РФ, белая заработная плата ДМС, включая госпитализацию, скорую и стоматологию Насыщенную корпоративную жизнь Обучение и семинары за счет компании Скидки от партнеров, льготная ипотека от Сбера Наша команда DS занимаются следующим: - Классические задачи: классификация/тематическое моделирование, NER, NEL, задачи поиска. Все не так просто, так как объемы большие, данные сильно вариативны - Нестандартные задачи: кластеризация / “как объединитьмагазины в полигоны по три, используя нечеткий спуск по графу” / “как отсортировать данные, чтобы ускорить разметку” / “как мэтчить млрд-ы id-шников по timestamp и total_sum”Почему у нас может быть интересно/полезно? • Cовременный стек, можно много чему научитьсяЧетко сформулированные задачи и метрики оценивания моделей • Развитая инфраструктура: есть несколько кластеров Hadoop, у DS естьнесколько мощных машин, GPU делают бр-бр • Некоторые задачи, действительно крутые, например, мы обучаем LLM-ы и всегда держим нос по ветру в плане SOTA(у нас хватает и данных, и ресурсов, т.к тексты короткие) • Нужно делать мало sql и немного уметь в Spark (или очень хотеть научиться) Стек, который мы используем:linux, git, bash(DS стек): jupyterhub, python, стандартный python стек (pandas, numpy, sklearn, matplolib, …), fasttext, torch, HuggingFace, transformers, BERT, LLM, MlFlow, Hadoop, Spark, Hive, Zeppelin/IntelliJ, AirFlow Откликайся, если ты: Работаешь в качестве DS от 1 года Знаешь Python и части DS стека Понимаешь, как устроены модели Готов иногда приезжать в офис Будет плюсом, если ты: имеешь опыт в классическом машинном обучении и практический опыт решения задач NLP знаешь, как работать в Zeppelin понимаешь, что иногда, хорошая регулярка лучше плохой модели умеешь в Spark или очень хочешь научиться Как проходит найм: Техническое интервью с TL команды DS Опционально: тестовое задание на дом или live coding во время тех.интервью Уровень дохода готовы обсуждать с успешными кандидатами

Имя не указано

Откликнуться
Разместить Резюме
Пожаловаться ID: 125711951

Похожие вакансии

Data Scientist NLP

Договорная

Москва. Станции метро: Спортивная, Лужники

СБЕР

Data Scientist (NLP)

От 240 000 руб.

Москва. Станции метро: Спортивная, Лужники

Алабуга, ОЭЗ ППТ

NLP Data Scientist

До 450 000 руб.

Москва. Станции метро: Спортивная, Лужники

Точка

Data Scientist (NLP/LLM)

Договорная

Москва. Станции метро: Спортивная, Лужники

ФИНАМ

Data Scientist (NLP&ML)

Договорная

Москва. Станции метро: Спортивная, Лужники

АКБ Национальный Резервный Банк

Data Scientist NLP (портал gosuslugi.ru)

Договорная

Москва. Станции метро: Спортивная, Лужники

РТЛабс