Обязанности:
Data Scientist (RAG Systems) — Middle+ / Senior Направление: LLM / NLP / Information Retrieval Формат: удалёнка ЗП: $4000 Технологический стек: Python Чем предстоит заниматься • Проектировать и улучшать многоступенчатые RAG-пайплайны: retriever → reranker → generator • Экспериментировать с чанкингом, эмбеддингами и векторными БД (Weaviate, Qdrant, FAISS) — включая гибридный поиск (BM25 + vector) • Разрабатывать компоненты retrieval-логики: query rewriting, expansion, decomposition, self-RAG, corrective RAG Внедрять и тюнить реранкеры (cross-encoders, ColBERT, LLM-based reranking) • Оценивать качество системы: Recall@K, MRR, NDCG, faithfulness, answer relevance, citation accuracy, A/B-тесты • Работать с LLM: промпт-инжиниринг, извлечение структурированной информации из документов; при необходимости fine-tuning / LoRA • Оптимизировать latency и cost: кэширование, квантизация, дистилляция, подбор моделей под задачу • Строить data pipelines для инжеста, парсинга и обогащения корпуса документов Мы ожидаем 3+ года практического опыта в NLP/IR и портфолио с RAG/LLM-проектами Уверенное владение Python Глубокое понимание информационного поиска: sparse retrieval (BM25), dense retrieval (bi-encoders), гибридные подходы Опыт с векторными индексами и настройкой поиска (HNSW, IVF, фильтрация по метаданным) Знание методов оценки качества RAG/NLP-систем (RAGAS, DeepEval, LLM-as-a-judge) Чтобы мы рассмотрели ваш отклик пришлите краткое описание ваших навыков в указанной сфере в произвольной форме.Похожие вакансии