Обязанности:
Технократия цифровизирует бизнес: от небольших компаний до крупных корпораций. СИБУР Диджитал, Камаз Digital, Татнефть, Университет Иннополис — наши клиенты. А ещё внутренние продукты, которые мы выводим на рынок. У нас прозрачные процессы, понятная система грейдов и прогнозируемый рост, культура наставничества, возможность влиять на проекты и быть услышанным. Ищем DE инженера в новое направление от мидла (есть удаленка), но если ты senior - будет вообще пушка, потому что, возможно, ты сможешь стать лидом нового направления). Чем предстоит заниматься: Мониторинг, поддержка, оптимизация ETL-процессов; Интеграция данных из различных источников (преимущественно batch-загрузки из SQL баз данных) Разработка коннекторов из внешних систем, включая SAP-системы (ERP, BW, MKT) к Hadoop Разработка интеграций в SAP Data Services Написание и постановка на расписание заданий для расчета витрин данных Создание расчетов для новых витрин данных Разработка новых и оптимизация существующих загрузок/выгрузок из Hadoop и ЯО Наши ожидания: Опыт работы от 2 лет Глубокое знание экосистемы Hadoop, включая HDFS, MapReduce, YARN, Hive, Spark и других компонентов (Airflow) Опыт работы с инструментами для обработки и анализа больших данных, такими как Apache Kafka и другими Понимание основ работы с NoSQL и реляционными базами данных, знание SQL Глубокие знания Python Опыт разработки в Grafana будет преимуществом Будет плюсом: Знание английского языка; Опыт работы с библиотеками для анализа данных, такими как Pandas и NumPy; Опыт работы с NoSQL (MongoDB, Clickhouse); Понимание принципов контейнеризации и умение работать с Docker. Стек технологий: Hadoop (HDFS, Hive, YARN, Spark, Kafka), БД Oracle, SAP Hana, Clickhouse, Postgres, MySQL, Airflow, ETL Spark, Python/Scala, SAP DS