Обязанности:
- Разработка, обучение, дообучение и применение моделей NLP (Text Classification, NER, Summarization, Question Answering);- Работа с крупными языковыми моделями (LLM): fine-tuning, адаптация и применение в прикладных сценариях;- Построение и оптимизация пайплайнов предобработки текстов и векторизации данных;- Анализ качества моделей, подбор метрик и улучшение производительности в условиях ограниченных вычислительных ресурсов;- Совместная работа с командой МЛ инженеров и продуктовой командами для внедрения решений в бизнес-процессы;- Поддержка, мониторинг и улучшение качества NLP-моделей после деплоя.
Требования:
- Опыт работы в роли Data scientist от 2 лет;- Работа с одним из фреймворков PyTorch/TensorFlow;- Знание основных подходов для предобработки и векторизации текста;- Наличие опыта решения задач NLP для текста (Text Classification, NER, Text Summarization, QA);- Знакомство и понимание основных принципов современных SOTA моделей NLP;- Владение: git, docker, sql и одним из фреймворков для реализации api. Будет плюсом: - Практический опыт до обучения и работы с open source LLM;- Публикации по NLP;- Собственные проекты по NLP.Похожие вакансии