Data Scientist (Feature Development) - Дата-сайентист

Более недели назад

З/П не указана

Город: Москва

AVO.UZ

Город: Москва

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 6 лет

AVO.UZ

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 6 лет

Команда AVO создает новый технологичный розничный банк на рынке Узбекистана. Основная концепция сервиса - клиент самостоятельно может получить все услуги банка через мобильное приложение и устройства самообслуживания. Наш сегодняшний вызов - создать самый продвинутый digital банк в Узбекистане. Мы ищем Дата-сайентиста (Data Scientist). Обязанности: Фичи и Feature Platform: проектировать, разрабатывать и валидировать признаки; обеспечивать их корректную доступность в обучении и на инференсе (offline/online), поддерживать документацию и жизненный цикл фичей. Качество фичей: оценивать значимость, устойчивость и влияние признаков (статистика, leakage, drift), оптимизировать существующие и добавлять новые. Модели end-to-end: разрабатывать и улучшать ML-модели, проводить эксперименты, валидацию и интерпретацию результатов. Шипмент в прод: доводить решение до production-уровня совместно с ML/Engineering: пайплайны, CI/CD, MLOps, мониторинг качества и данных после релиза. Требования: Feature Platform / Feature Engineering Понимание, что такое фича в продуктовой и технической логике: определение, окно агрегации, гранулярность, entity key, правила обновления, offline/online. Умение разрабатывать фичи в платформе/feature store (Feast или аналог): источники данных, материализация, контроль качества, версионирование и повторяемость расчётов. Знание типовых рисков: data leakage, смещение, дубли, несогласованность ключей, временные сдвиги, корректная работа с time-aware данными. Моделирование Уверенное построение ML-моделей на табличных данных: постановка задачи, разметка таргета, валидация (CV/Time-split), подбор метрик, тюнинг. Умение объяснять вклад факторов и принимать решения по фичам/модели на основе данных (importance, SHAP/аналоги, ablation, стабильность по сегментам) Технический стек: Python + SQL + DWH Сильный Python для продакшн-кода: pandas/NumPy, sklearn, CatBoost/LightGBM (или аналоги), аккуратная структура проекта, тестируемость. Сильный SQL: сложные join’ы, оконные функции, агрегации, оптимизация запросов; уверенная работа с DWH (Greenplum/PostgreSQL). Понимание, как строить воспроизводимые датасеты и расчёты на больших данных (производительность, профилирование, контроль ресурсов). Production mindset: CI/CD и MLOps Понимание полного ML-цикла: подготовка данных → обучение → артефакты → деплой → инференс → мониторинг. Опыт/понимание: Git, CI/CD, контейнеризация (Docker), трекинг экспериментов/артефактов (MLflow или аналог), базовый мониторинг (качество модели, drift, data quality, latency). Плюсом будет: Практика в задачах маркетинга/поведения клиентов: churn/retention, uplift/таргетинг, сегментации, LTV, A/B-мышление. Опыт продуктовой аналитики и коммуникации: формулировать гипотезы, переводить результат в действие для бизнеса. Условия: Трудоустройство в соответствии с ТК Республики Узбекистан. Оплачиваемый отпуск и больничные. Помощь с релокацией для тех, кто переезжает в солнечный Ташкент. Выдаем технику. Высокая конкурентная заработная плата. Амбициозный проект, в котором ты будешь играть одну из важнейших ролей. Где предстоит работать: Ташкент, улица Нукус, 29А - или удаленно в любом схожем часовом поясе. Для оформления необходимо посетить офис в Ташкенте (мы оплачиваем перелет и проживание в гостинице).

Показать контакты

Контакт:

Имя не указано

При звонке сообщите, что Вы нашли вакансию на Rabix.ru

Откликнуться

Разместить Резюме

Распечатать Пожаловаться ID: 153289687