Обязанности:
Команда AI VK развивает технологии искусственного интеллекта для ключевых продуктов компании, разрабатывает систему рекомендаций и поиска контента на наших платформах, чтобы 95% пользователей рунета быстро и эффективно решали свои задачи с помощью сервисов VK.
Наша команда отвечает за качество поиска по видео, текстам, музыке в Одноклассниках, ВКонтакте и Дзене. А ещё мы делаем поиск для голосового ассистента Маруся. Мы ищем разработчика, готового вместе с нами помогать десяткам миллионов пользователей быстро и легко находить нужное в рунете.
В работе мы используем:
ꔷ для обучения и инференса — PyTorch, CatBoost, Scikit-learn, pandas, ONNX Runtime, TensorRT;
ꔷ для инженерных задач — Python для обработки данных и обучения, C++ для программирования в бэкенде, немного Java для работы с петабайтами данных.
Задачи:
ꔷ обучать модели ранжирования поисковой выдачи;
ꔷ обучать модели классификации текстов, музыки, видео;
ꔷ придумывать и реализовывать новые факторы ранжирования;
ꔷ реализовывать идеи, алгоритмы и модели из научных статей;
ꔷ выдвигать гипотезы, получать данные для их проверки, ставить эксперименты и анализировать их результаты;
ꔷ следить за актуальными подходами к информационному поиску и учитывать их.
Требования:
ꔷ вы уже работали с машинным обучением — знаете базовую теорию, классические алгоритмы ML и Deep Learning, современные подходы в NLP;
ꔷ имеете опыт реализации ML-проектов от постановки задачи до выведения в продакшн и оценки результатов;
ꔷ отлично владеете Python;
ꔷ хорошо знаете классические алгоритмы и структуры данных.
Будет плюсом:
ꔷ вы знаете Java, знакомы с алгоритмами обработки больших данных и парадигмой MapReduce;
ꔷ вы знаете основы C++, чтобы понимать код нашего поискового бэкенда;
ꔷ интересуетесь поиском или рекомендательными системами и хорошо в них разбираетесь;
ꔷ внедряли нейросетевые решения и умеете оптимизировать время инференса и потребление ресурсов;
ꔷ самостоятельно ставили A/B-эксперименты.
У нас интересно, потому что вы сможете:
ꔷ максимально свободно формировать гипотезы;
ꔷ проверять самые невероятные идеи;
ꔷ увидеть и «пощупать» результаты своей работы на многомиллионной аудитории;
ꔷ поработать над высоконагруженным сервисом, где скорость работы и исправность любого решения — не формальность, а критически важные факторы.