Привет, мы — NGENIX — команда профессионалов, которая ежедневно делает Рунет безопасной средой для бизнеса. Нам есть что рассказать о доступности, защите и ускорении веб-приложений, ведь это то, чем мы занимаемся уже 17 лет! Слышали про UDP flood, credential stuffing, скальпинг, DNS cache poisoning? Мы такое знаем и отражаем. Правда, защита от киберугроз — не единственная сфера нашего интереса. Нам доверяют: Золотое Яблоко, OBI, CDEK.Shopping, Kari, ROSTIC`S и сотни других компаний. Мы помогаем клиентам справляться с высокими нагрузками даже в периоды больших распродаж на маркетплейсах или громких премьер в онлайн-кинотеатрах. Обеспечиваем постоянную доступность веб-ресурсов, чтобы миллионы пользователей легко взаимодействовали с сайтами и приложениями наших заказчиков. Ищем инженера для построения внутренней ML-платформы с нуля. Главная цель — систематизация жизненного цикла моделей и организация эффективной работы дата-аналитиков. Обязанности: Разработать и внедрить комплексную MLOps-платформу на базе ClickHouse: - Обеспечить извлечение и трансформацию данных (feature engineering) в ClickHouse.- Спроектировать и реализовать Feature Store.- Построить автоматизированный ML-пайплайн (подготовка, обучение, валидация, деплой, мониторинг).- Внедрить систему версионирования для обеспечения воспроизводимости экспериментов. Создать и настроить централизованную среду для Data Science: - Развернуть и интегрировать инструменты для экспериментов (JupyterHub/Lab, MLflow/KubeFlow или аналоги). Автоматизировать цикл «данные → модель → прод»: - Реализовать процессы ETL.- Обеспечить автоматическую подготовку данных для обучения моделей.- Внедрить CI/CD для автоматического деплоя и мониторинга моделей в production. Подготовить документацию и обучить пользователей платформы: - Разработать документацию для архитектуры, процессов и использования платформы.- Создать обучающие материалы и best practices для пользователей. Требования: Опыт построения ML-пайплайнов end-to-end: от данных до деплоя модели в прод (2+ года в MLOps / Data Engineering с ML-фокусом); Опыт работы с ClickHouse или аналогичными колоночными СУБД; ETL / оркестрация: Airflow, KubeFlow или аналоги; Трансформация данных: dbt, materialized views, SQL-пайплайны для подготовки фичей; Контейнеризация и инфраструктура: Docker, Kubernetes; CI/CD для ML: автоматизация обучения, тестирования и деплоя моделей; Эксперимент-трекинг и реестр моделей: MLflow или аналоги; Python — уверенный уровень; Опыт настройки JupyterHub / аналогичных сред для команды. Будет плюсом: Опыт построения ML-платформ с нуля; Опыт работы с потоковой обработкой данных (Kafka); Опыт менторства или организации процессов для команд data-аналитиков; Опыт работы data-аналитиком или data-scientist.
Похожие вакансии
MlOps/ Ml Engineer (Платформа MlOps)
Договорная
Москва. Станции метро: Динамо, Гражданская, Петровский парк
X5 Tech
Договорная
Москва. Станции метро: Динамо, Гражданская, Петровский парк
ВИМ Инвестиции
Договорная
Москва. Станции метро: Динамо, Гражданская, Петровский парк
Лаборатория Касперского
Договорная
Москва. Станции метро: Динамо, Гражданская, Петровский парк
Aston
Договорная
Москва. Станции метро: Динамо, Гражданская, Петровский парк
OneTwoTrip