Обязанности:
сбор информации, анализ источников данных; анализ качества данных в системе, разработка механизмов мониторинга; разработка интеграционных спецификаций, включающих сопоставление полей и логику трансформации данных; разработка SQL-функций и ETL-процессов; разработка витрин, представлений данных, отчётов и Ad Hoc запросов; реализация потоков загрузки данных в Apache Airflow.
Требования:
высшее образование; релевантный опыт работы от 1 года; владение SQL различных реализаций, python, библиотеки pandas, библиотеки визуализации, умение использовать API; знание принципов реляционных БД и NoSQL решений, Airflow и python, MS Excel; опыт работы с форматами json, xml и способами их трансформации xpath, xslt; желателен опыт работы с Big Data решениями (стек Hadoop, Greenplum); готовность к офисному/гибридному формату работы.Похожие вакансии