Команда занимается улучшением работы аналитиков в платформе данных. Анализируем, как работает наше хранилище, ищем способы ускорить запросы, сократить число ошибок, улучшить инструменты (DLH, Greenplum, Proteus и пр). В частности, курируем миграцию на новое хранилище даных DLH и работу в нем. Поэтому много новых задач, связанных с этой миграцией, и в рамках данной вакансии планируем найти сотрудника на задачи : анализа оптимальности запросов, преобразования кода Greenplum -> Trino|Spark управления вычислительным ресурсом (выделение ресурсов под бизнес-линию, рассадка по кластерам и пр) создание дашбордов с визуализацией по оптимальности и утилизации ресурса разбора сложных сценариев и выработки практик работы в хранилище данных (как для пользователей, так и для инструментов). Требования: Высокий уровень SQL (в частности, оптимизация запросов); Опыт визуализации в Apache Superset, Tableau или аналогичных средах; Хорошее знание Python для работы с данными; Умение работать с Git-ом Spark, Trino, ML, Grafana - как преимущество Обязанности: Общий стрим заключается в миграции пользовательских процессов из одной среды (greenplum) в другую (trino/spark), а также ряд связанных с этим задач: разбор пользовательских сценариев аналиков (что-делают зачем, что мешает переехать, какие ошибки могут возникнуть в переезде и как их решить - на уровне изменения кода/логики процесса; аналитика хода работ, выбор приоритетных вариантов переезда, предложения по доработке платформы; визуализация хода процесса и итогов работ.
Похожие вакансии
Договорная
Москва. Станции метро: Белорусская
Ситуационно-Информационный Центр Министерства Транспорта Российской Федерации
От 119 800 до 180 000 руб.
Москва. Станции метро: Белорусская
Объединенная Энергетическая Компания