Обязанности:
Команда ML за 7 лет реализовала более 50 проектов с использованием машинного обучения, таких как кредитный скоринr, поиск фрода, neuro-OCR, распознавание лиц и документов и т. д. В нашей команде дата-инженеры занимаются организацией данных и витрин для их получения. Главные потребители наших данных – data scientist’ы, которые занимаются поиском закономерностей, значимых признаков в данных и тренировкой моделей машинного обучения. Стек: JVM стек, все новое пишем на Scala. В работе используем Big Data инструменты: Hadoop, Spark, Airflow; БД Cassandra, Elastic, Clickhouse; для кода – IntelliJ Idea, Git, Maven/Gradle, JUnit. Спектр задач широкий: проектирование и построение DWH подготовка витрин данных для отчетности, бизнеса и дата аналитики организация пайплайнов сбора данных от бэкендов и других хранилищ организация пайплайна подготовки датасетов для обучения ML модулей организация сбора метрик с инфраструктуры поддержка текущих ETL пайплайнов На минималках потребуется: Java8+, Scala или Python на хорошем уровне Знание алгоритмов и структур данных Знание SQL и принципов работы классических БД Желание развиваться в BigData и ML Какие еще навыки будут полезны в работе: Hadoop, Spark, YARN, Hive, Impala noSQL базы: Cassandra, Elastic Анализ данных при помощи Python-ноутбуков Jupyter, Zeppelin Работа с очередями сообщений: Kafka, Rabbit, JMS Мы предлагаем: Понятную траекторию роста (последовательный и хороший онбординг, регулярные performance review, карьерные консультации, индивидуальная карта развития) Обучение и развитие за счет ресурсов компании (Учебный Центр, корпоративная библиотека, оплата внешнего обучения по согласованию) Социальный пакет (ДМС с первого дня, скидки от партнеров) Насыщенная корпоративная жизнь (радио, подкасты, кибертурнир, собственные мероприятия и участие в крупных событиях отрасли) Возможность быть преподавателем, наставником, спикером – каждый выбирает, что подходит именно ему Официальное трудоустройство в аккредитованной компании, белая зарплата