Обязанности:
Мы ищем инженера данных для участия в развитии платформы машинного обучения дочерней компании OneFactor. Нашими продуктами пользуются 80% банковского сектора России Наши преимущества: Возможность увидеть результат вашей работы. Для некоторых задач по результатам одного спринта Работа с уникальным массивом данных из разных секторов экономики с максимальным охватом в РФ Чем предстоит заниматься Разрабатывать отчетность с использованием скриптов на PySpark Генерировать новые признаки для ML-моделей Автоматизировать процессы для бизнеса Для решения этих задач требуется Опыт работы с большими данными: HDFS, PySpark от 1 года Опыт работы с Python, в том числе с Pandas, NumPy Будет плюсом Опыт работы с геоданными, gitПохожие вакансии