Обязанности:
Чем предстоит заниматься: Разработка и поддержка NLP-пайплайнов: суммаризация, коррекция и перевод текста; Задачи классификации, генерации и извлечения информации из текстовых данных; Работа с мультиязычными датасетами; Оптимизация и оценка качества моделей обработки естественного языка; Трекинг экспериментов и контроль версий моделей. Наш стек технологий: ЯП: Python=>3.11; Фреймворки ML: PyTorch, HuggingFace Transformers; Среды для разработки и деплоя: Jupyter, Docker, MLflow, n8n; Системы управления версиями: Git, GitLab; ОС: Linux. Что мы ждем от Вас: Опыт работы с NLP-задачами: суммаризация, машинный перевод, коррекция текста; Опыт файн-тюнинга многоязычных моделей; Понимание специфики работы с разными языками; Понимание архитектуры Transformer и seq2seq-моделей; Понимание ML-метрик качества; Проведение исследований и разработка воспроизводимых пайплайнов; Знание принципов ООП, SOLID; Знание и применение паттернов проектирования. Будет плюсом: Опыт работы с ASR (Whisper, NeMo и др.); Опыт работы с низкоресурсными языками; Опыт деплоя моделей: ONNX, Triton, TensorRT.Похожие вакансии
От 200 000 до 250 000 руб.
Москва. Станции метро: Дмитровская, Бутырская
Diamond Personnel R&C
От 250 000 руб.
Москва. Станции метро: Дмитровская, Бутырская
Фомин Сергей Александрович
От 250 000 до 300 000 руб.
Москва. Станции метро: Дмитровская, Бутырская
North Side