Обязанности: разработка и настройка механизмов для автоматизированного сбора данных для целей контроля моделей машинного обучения; обеспечение корректности и полноты сбора данных, а также оптимизация процессов разработки и внедрения с применением оптимизационных механизмов; разработка пайплайнов для предобработки данных и преобразование их в форматы, оптимальные для дальнейшего хранения, обработки и использования в аналитических задачах; проектирование и реализация способов хранения и внедрения результатов во внутреннее хранилище с целью последующей аналитики; применение современных инструментов для улучшения результатов работы, а также сопровождение внедренных решений в промышленную эксплуатацию; интерпретация результатов работы моделей и проверок качества данных для выявления эффективных триггеров для бизнеса. Требования: высшее техническое или финансово-математическое образование; продвинутый уровень владения Python, SQL; опыт работы с PySpark и оркестраторами AirFlow; умение создавать продвинутые аналитические решения на базе имеющихся данных; опыт реализации практических задач в технологии Apache Superset; опыт самостоятельного ведения задачи от бизнес-требований до представления заказчику; опыт работы с результатами инструментов, построенных на базе машинного обучения.
Похожие вакансии
Договорная
Москва. Станции метро: Деловой центр, Москва-Сити
М.Видео-Эльдорадо
Data Scientist middle/middle+ (ML)
Договорная
Москва. Станции метро: Деловой центр, Москва-Сити
РУСАЛ
Data Scientist (валидация ml моделей)
Договорная
Москва. Станции метро: Деловой центр, Москва-Сити
СБЕР
Data Scientist (валидация ml моделей)
Договорная
Москва. Станции метро: Деловой центр, Москва-Сити
СБЕР