other

Junior Data Scientist

18 ноября 2024

З/П не указана

Город: Москва. Станции метро: Преображенская площадь

Циан

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 1 года

Обязанности:

Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10. Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков. Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж. cian.ru — это большой и сложный продукт, в котором представлено несколько типов недвижимости и типов сделки, а также есть множество сервисов, информационных материалов и собственное медиа. Ежемесячная аудитория около 18,7 млн. человек. Растить число пользователей и решать их проблемы помогают уже больше 1000 человек. О команде: В Циан большая команда ML - DS, своя MLOps-платформа. Команда разделена на продуктовые стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес-направления. С процессами интеграции моделей в продакшн нам помогает команда MLOps-платформы. В команде настроены процессы перфоманс ревью, регулярного обмена опытом, выделяем время на исследовательскую работу. Мы ищем Junior Data Scientist в команду Вторичка. Команда создает продукты для направления вторички. Большим core-функционалом команды является модель поиска дублей объявлений, на основе которых мы строим другие продукты для отделов продаж, модерации, сайта и тд. Стек: Пишем преимущественно на Python (Numpy, SciPy, Pandas, sklearn, PyTorch). Активно используем экосистему Hadoop (PySpark, Hive, Kafka), у нас свой большой кластер Для автоматизации запусков наших пайплайнов используем Airflow Для технических метрик — Grafana, для бизнес-метрик — FineBI Основные задачи, которые нужно будет решать: Построение универсальных эмбеддингов квартир - Flat2Vec. Решение задачи Metric Learning для векторизации объектов. Построение универсальных эмбеддингов пользователей на истории кликов пользователей. Решение задачи masked token modelling / next token prediction на кликстриме. Требования к кандидату: Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др. Python - пишет легко читаемый и поддерживаемый код; SQL - умеет писать базовые запросы, вытащить данные, проверить гипотезы на уровне SQL; DL - знаком с PyTorch, знает базовые подходы в нейросетях и архитектуры. Понимает как решаются задачи metric learning, masked token modeling, next token prediction. Что мы предлагаем: Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе – кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки; Технический рост. У нас есть успешные примеры роста с точки зрения ML, а также инженерии (разработка, архитектура приложений и сервисов) : есть возможность консультироваться с командой и брать инициативу по реализации крупных и сложных проектов. Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/ hard skills на практике, обучении, конференциях;

Имя не указано

Откликнуться
Разместить Резюме
Пожаловаться ID: 125082458

Похожие вакансии

Junior+ Data Scientist

До 150 000 руб.

Москва. Станции метро: Преображенская площадь

ANCOR

Data Scientist (Junior)

До 120 000 руб.

Москва. Станции метро: Преображенская площадь

Алабуга, ОЭЗ ППТ

Data Scientist Junior +

Договорная

Москва. Станции метро: Преображенская площадь

Бюро кредитных историй Скоринг Бюро

Data Analyst / Data Scientist (Junior/Junior+)

Договорная

Москва. Станции метро: Преображенская площадь

Kept (Кэпт)

Data Scientist

Договорная

Москва. Станции метро: Преображенская площадь

Ростелеком

Data Scientist

Договорная

Москва. Станции метро: Преображенская площадь

Бэнкс Софт Системс