Обязанности:
Команда AI VK развивает технологии искусственного интеллекта для ключевых продуктов компании, разрабатывает систему рекомендаций и поиска контента на наших платформах, чтобы 95% пользователей рунета быстро и эффективно решали свои задачи с помощью сервисов VK. Наша команда отвечает за качество поиска по видео, текстам, музыке в Одноклассниках, ВКонтакте и Дзене. А ещё мы делаем поиск для голосового ассистента Маруся. Мы ищем разработчика, готового вместе с нами помогать десяткам миллионов пользователей быстро и легко находить нужное в рунете. В работе мы используем: для обучения и инференса — PyTorch, CatBoost, Scikit-learn, Pandas, ONNX Runtime, TensorRT; для инженерных задач — Python для обработки данных и обучения, C++ для программирования в бэкенде, немного Java для работы с петабайтами данных. Задачи: обучать модели ранжирования поисковой выдачи; обучать модели классификации текстов, музыки, видео; придумывать и реализовывать новые факторы ранжирования; реализовывать идеи, алгоритмы и модели из научных статей; выдвигать гипотезы, получать данные для их проверки, ставить эксперименты и анализировать их результаты; следить за актуальными подходами к информационному поиску и учитывать их. Требования: вы уже работали с машинным обучением — знаете базовую теорию, классические алгоритмы ML и Deep Learning, современные подходы в NLP; имеете опыт реализации ML-проектов от постановки задачи до выведения в продакшен и оценки результатов; отлично владеете Python; хорошо знаете классические алгоритмы и структуры данных. Будет плюсом: вы знаете Java, знакомы с алгоритмами обработки больших данных и парадигмой MapReduce; вы знаете основы C++, чтобы понимать код нашего поискового бэкенда; интересуетесь поиском или рекомендательными системами и хорошо в них разбираетесь; внедряли нейросетевые решения и умеете оптимизировать время инференса и потребление ресурсов; самостоятельно ставили A/B-эксперименты. У нас интересно, потому что вы сможете: максимально свободно формировать гипотезы; проверять самые невероятные идеи; увидеть и «пощупать» результаты своей работы на многомиллионной аудитории; поработать над высоконагруженным сервисом, где скорость работы и исправность любого решения — не формальность, а критически важные факторы.