Обязанности:
Привет! Мы в поисках Data scientist (middle) на задачи: Сегментация пользователей и персонализация предложений Построение и автоматизация пайплайнов машинного обучения Наш стек Python Airflow, MLflow Hadoop (Hive, Spark, etc.), Oracle (SQL, PL/SQL) Linux, Bash, Git. Какие задачи необходимо решать Разработка и внедрение ML-моделей: от идеи и анализа до проверки гипотез и проведения пилотов Построение решений для автоматизации выборки целевых пользователей и персонализированных рекомендаций Проведение экспериментов и A/B тестов, анализ их результатов Работа с большими объемами данных, их очистка, обработка и подготовка для обучения моделей Что для этого нужно Уверенное владение методами машинного обучения Опыт работы с PL/SQL Уверенное владение Python и библиотеками машинного обучения Способность проводить глубокую аналитику данных и генерировать идеи для их улучшения Понимание принципов работы экосистемы Hadoop и опыт работы с ней (Hive, PySpark) Плюсом будет Опыт автоматизации процессов с использованием Airflow Опыт работы с MLflow для отслеживания экспериментов