Обязанности:
О команде и задаче:Мы создаем технологии беспилотного вождения. У нас накоплены петабайты данных с проездов, которые нужно превратить в полезный датасет для обучения. Твоя задача — не просто сидеть в Jupyter, а построить «фабрику» по автоматической разметке сложных дорожных ситуаций (Scenario Mining) с использованием современных подходов (LLM, VLM, CV) и масштабировать это решение на весь наш архив данных. Чем предстоит заниматься: Разработка методов авторазметки: создание новых и адаптация существующих моделей (в т.ч. VLM и LLM) для семантического поиска событий в проездах (например, «найти все нерегулируемые левые повороты с пешеходами»); Пайплайны обработки данных: оборачивание ML-моделей в воспроизводимые пайплайны для массовой обработки исторических и новых данных; Работа с данными: организация эффективного чтения/записи результатов в S3, версионирование экспериментов и датасетов через ClearML. Что мы ждем от кандидата: Отличное знание Python, PyTorch, понимание архитектур трансформеров и опыт работы с LLM / VLM (CLIP, LLaVA, GPT-4V API или open-source аналоги). Нам нужно, чтобы модель «понимала» сцену Fine-tuning; База по Computer Vision (детектирование, сегментация, трекинг объектов). MLOps & Engineering (Важно): опыт работы с объектными хранилищами (S3); умение писать эффективный код, который не кладет сеть и сторадж при массовом чтении); работа с данными, опыт обработки больших объёмов данных (pandas, numpy, SQL или аналоги); умение строить ETL/ELT пайплайны; умение работать с SQL, Docker 4. Инструментарий: опыт работы с системами трекинга экспериментов (ClearML / MLFlow); JupyterHub как среда для прототипирования. Будет плюсом++ Опыт в Autonomous Driving: понимание сенсорики (Lidar, Radar, Camera) и специфики данных (rosbag, pcap и т.д.); Data Engineering: опыт работы с Spark для препроцессинга данных, ClickHouse/Metabase для записи и поиска данных, с оркестраторами - Dagster.Похожие вакансии
Machine Learning Lead engineer
Договорная
Москва. Станции метро: Автозаводская, ЗИЛ, Технопарк
Специализированный депозитарий ИНФИНИТУМ
Machine Learning Engineer (Рекомендательные системы)
Договорная
Москва. Станции метро: Автозаводская, ЗИЛ, Технопарк
СБЕР
Machine Learning Engineer (Рекомендательные системы)
Договорная
Москва. Станции метро: Автозаводская, ЗИЛ, Технопарк
СБЕР
Договорная
Москва. Станции метро: Автозаводская, ЗИЛ, Технопарк
ПИК-специализированный застройщик
Deep Learning Engineer в команду Perception
Договорная
Москва. Станции метро: Автозаводская, ЗИЛ, Технопарк
Navio