Обязанности:
Платформа ОФД - продуктовая IT- компания, крупнейший в России оператор фискальных данных. № 1 в рейтинге ОФД по данным CNews, резидент Сколково. Мы анализируем рынок российского ритейла на данных из чеков в режиме реального времени. Ежедневно мы обрабатываем 60 млн кассовых чеков - каждый 3-й чек, пробиваемый в России. В нашей базе 2 млрд уникальных названий товаров. Мы предлагаем условия: Комфортный офис с relax зоной близко от м. Спортивная / МЦК Лужники График работы гибридный: офис 1-2 раза в неделю. Гибкое время начала рабочего дня Трудоустройство по ТК РФ, белая заработная плата ДМС, включая госпитализацию, скорую и стоматологию Насыщенную корпоративную жизнь Обучение и семинары за счет компании Скидки от партнеров, льготная ипотека от Сбера Наша команда DS занимаются следующим: - Классические задачи: классификация/тематическое моделирование, NER, NEL, задачи поиска. Все не так просто, так как объемы большие, данные сильно вариативны - Нестандартные задачи: кластеризация / “как объединитьмагазины в полигоны по три, используя нечеткий спуск по графу” / “как отсортировать данные, чтобы ускорить разметку” / “как мэтчить млрд-ы id-шников по timestamp и total_sum”Почему у нас может быть интересно/полезно? • Cовременный стек, можно много чему научитьсяЧетко сформулированные задачи и метрики оценивания моделей • Развитая инфраструктура: есть несколько кластеров Hadoop, у DS естьнесколько мощных машин, GPU делают бр-бр • Некоторые задачи, действительно крутые, например, мы обучаем LLM-ы и всегда держим нос по ветру в плане SOTA(у нас хватает и данных, и ресурсов, т.к тексты короткие) • Нужно делать мало sql и немного уметь в Spark (или очень хотеть научиться) Стек, который мы используем:linux, git, bash(DS стек): jupyterhub, python, стандартный python стек (pandas, numpy, sklearn, matplolib, …), fasttext, torch, HuggingFace, transformers, BERT, LLM, MlFlow, Hadoop, Spark, Hive, Zeppelin/IntelliJ, AirFlow Откликайся, если ты: Работаешь в качестве DS от года Знаешь Python и части DS стека Пишешь красивый код Понимаешь, как устроены модели Имеешь в/о Будет плюсом, если ты: работаешь в DL и умеешь читать статьи имеешь опыт в классическом машинном обучении и практический опыт решения задач NLP знаешь, как работать в Zeppelin умеешь в Spark или очень хочешь научиться Как проходит найм: Техническое интервью с TL команды DS Опционально: тестовое задание на дом или live coding во время тех.интервью Уровень дохода готовы обсуждать с успешными кандидатамиДоговорная
Москва. Станции метро: Спортивная, Лужники
Цифровые технологии и платформы