Обязанности:
Команда AI VK развивает технологии искусственного интеллекта для ключевых продуктов компании, разрабатывает систему рекомендаций и поиска контента на наших платформах, чтобы 95% пользователей рунета быстро и эффективно решали свои задачи с помощью сервисов VK. Наша команда отвечает за качество поиска по видео, текстам, музыке в Одноклассниках, ВКонтакте и Дзене. А ещё мы делаем поиск для голосового ассистента Маруся. Мы ищем разработчика, готового вместе с нами помогать десяткам миллионов пользователей быстро и легко находить нужное в рунете. В работе мы используем: ꔷ для обучения и инференса — PyTorch, CatBoost, Scikit-learn, pandas, ONNX Runtime, TensorRT; ꔷ для инженерных задач — Python для обработки данных и обучения, C++ для программирования в бэкенде, немного Java для работы с петабайтами данных. Задачи: ꔷ обучать модели ранжирования поисковой выдачи; ꔷ обучать модели классификации текстов, музыки, видео; ꔷ придумывать и реализовывать новые факторы ранжирования; ꔷ реализовывать идеи, алгоритмы и модели из научных статей; ꔷ выдвигать гипотезы, получать данные для их проверки, ставить эксперименты и анализировать их результаты; ꔷ следить за актуальными подходами к информационному поиску и учитывать их. Требования: ꔷ вы уже работали с машинным обучением — знаете базовую теорию, классические алгоритмы ML и Deep Learning, современные подходы в NLP; ꔷ имеете опыт реализации ML-проектов от постановки задачи до выведения в продакшн и оценки результатов; ꔷ отлично владеете Python; ꔷ хорошо знаете классические алгоритмы и структуры данных. Будет плюсом: ꔷ вы знаете Java, знакомы с алгоритмами обработки больших данных и парадигмой MapReduce; ꔷ вы знаете основы C++, чтобы понимать код нашего поискового бэкенда; ꔷ интересуетесь поиском или рекомендательными системами и хорошо в них разбираетесь; ꔷ внедряли нейросетевые решения и умеете оптимизировать время инференса и потребление ресурсов; ꔷ самостоятельно ставили A/B-эксперименты. У нас интересно, потому что вы сможете: ꔷ максимально свободно формировать гипотезы; ꔷ проверять самые невероятные идеи; ꔷ увидеть и «пощупать» результаты своей работы на многомиллионной аудитории; ꔷ поработать над высоконагруженным сервисом, где скорость работы и исправность любого решения — не формальность, а критически важные факторы.