Обязанности:
Наша команда разрабатывает ML-сервисы Yandex SpeechKit, OCR и Vision, Translate, YandexGPT, Alice AI и инструменты, которые помогают специалистам по Data Science обучать нейросетевые модели на десятках терабайт данных и сотнях GPU, контролировать эксплуатацию этих моделей в облаке и в контуре клиента. Помимо этих базовых ML-технологий, мы сами разрабатываем и продукты поверх них. Например, Realtime API (для speech-to-speech голосовых помощников), AI Search (платформу для построения раг-решений), SpeechSense (платформу речевой аналитики). Мы ищем специалиста по Data Science и аналитике. Какие задачи вас ждут: Анализировать пользовательский опыт и строить метрики и процессы оценки качества ML-сервисов и продуктов Чтобы улучшать качество наших моделей и продуктов, понимать их сильные и слабые места и приоритизировать планы разработки новой функциональности, необходима качественная и количественная аналитика. Без метрик и приборов, которые покажут, куда необходимо двигаться, жить нельзя — и вы поможете нам строить такие приборы и процессы их регулярного обновления. Строить процессы разметки данных для обучения ML-моделей Один из ключевых факторов, влияющих на качество ML-моделей, — это данные для обучения. Вы будете разрабатывать процессы сбора и разметки данных, оценивать и улучшать качество процессов. Примеры задач: разметка данных для распознавания речи на узбекском языке; сбор обучающих данных для задач текстовой классификации. Помогать проверять продуктовые гипотезы Мы не только разрабатываем модели, но и помогаем внедрять их в продукты. При внедрении возникает множество гипотез о том, что и как можно сделать с помощью моделей. Для проверки гипотез часто требуется разработать и проанализировать прототип, выбрать лучший вариант решения задачи. Вы поможете менеджерам продукта и разработчикам строить прототипы и изучать варианты технических решений. Пример задачи: анализ разных алгоритмов кластеризации текстов на основе GPT. Мы ждем, что вы: Пишете на Python Хорошо знаете статистику Разбираетесь в современных методах ML и NLP Обрабатывали и анализировали большие объёмы данных с помощью pandas, SQL, статистических пакетов, библиотек для визуализации данных, Spark SQL, Spark, Hadoop Работали с системами контроля версий, например с Git Будет плюсом, если вы: Работали с DataLens Работали с краудсорсингом (Яндекс Толокой, Яндекс Заданиями)Похожие вакансии
Data Scientist, Диалоговый ИИ и ML сервисы
Договорная
Москва. Станции метро: Фрунзенская, Парк культуры, Кропоткинская
Ozon
Договорная
Москва. Станции метро: Фрунзенская, Парк культуры, Кропоткинская
АПТЕКА ВАША № 1
От 90 000 до 150 000 руб.
Москва. Станции метро: Фрунзенская, Парк культуры, Кропоткинская
Codemate Team (ИП Дегтярев Михаил Алексеевич)
Договорная
Москва. Станции метро: Фрунзенская, Парк культуры, Кропоткинская
РУСАЛ
Договорная
Москва. Станции метро: Фрунзенская, Парк культуры, Кропоткинская
Медиалогия
От 3 500 до 4 350 руб.
Москва. Станции метро: Фрунзенская, Парк культуры, Кропоткинская
ПБК Менеджмент