other

NLP Engineer/NLP Data Scientist

5 ноября 2024

З/П не указана

Город: Санкт-Петербург

ТехЛАБ

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

Обязанности:

Компания ТехЛаб - создатель высокотехнологичных IT‑решений для государственных и частных компаний, мы создаем решения от идеи до получения результата, предлагая свою отраслевую экспертизу. Проекты компании направлены на автоматизацию процессов работы медицинского персонала, улучшение качества и доступности медицинских услуг за счет анализа и обработки медицинских данных. Наш проект растет, и мы ищем нового члена нашей дружной команды - специалиста по Data Science с опытом в NLP. Основные задачи: Анализ и обработка больших объемов неструктурированных или слабоструктурированных медицинских текстовых данных; Разработка и реализация алгоритмов для классификации, кластеризации и извлечения полезной информации из медицинских текстов; Создание NLP-моделей для обработки естественного языка; Сотрудничество с командой разработчиков для интеграции разработанных моделей в конечные продукты; Участие в полном цикле ML-разработки от исследования до внедрения и мониторинга; Взаимодействие с медицинскими экспертами для улучшения качества и релевантности результатов обработки информации; Генерация гипотез и поиск точек роста продуктов на основе данных историй взаимодействия с пользователями; Разработка новых подходов и процессов разметки данных для оценки качества работы моделей; Оптимизация пайплайна исполнения на CPU/GPU инфраструктуре. Требования: Хорошие знания Python и умение писать понятный, качественный, чистый код; Опыт работы над NLP-задачами от двух лет; Глубокие знания в области машинного обучения и анализа текстов, включая опыт работы с библиотеками NLP (NLTK, SpaCy, Gensim, pyonmttok и пр.); Знание классических методов: tf-idf, Skip-gram, CBoW, CRF, FSTs, HMM; Опыт работы с MLFlow, Docker, Streamlit, FastAPI, TensorFlow, традиционным DS-стеком (numpy, pandas, matplotlib, sklearn); Опыт работы с git; Опыт доведения ML моделей до продакшн стадии; Умение работать с большими объемами данных, разработка оптимальных алгоритмов для эффективной обработки. Высшее образование в области компьютерных наук, прикладной математики, статистики или в смежных областях; Будет плюсом: Опыт в области анализа медицинских текстов или работы над проектами в области здравоохранения; Опыт запуска пилотных проектов и проведения А/В тестов; Опыт работы с SQL; Опыт работы с инструментами разработки и CI/CD; Знание современных архитектур и моделей — рекуррентные и свёрточные сети, современные языковые модели (BERT, BART, Т5 и т.п.), LLM (+ методов их тюнинга RAG, RLHF, LoRa). Условия: Официальное трудоустройство; Современный офис в пешей доступности от м. Гостиный двор; Гибридный формат работы. Вы можете работать как в офисе, так и дома; Конкурентоспособную заработную плату (обсуждается индивидуально, зависит от вашего опыта и квалификации); Расширенный социальный пакет: ДМС (включая стоматологию), компенсация питания, мотивационная программа, корпоративное обучение; Возможность профессионального и карьерного роста; Участие в социально значимом проекте; Зона отдыха, вкусный кофе и печеньки; Дружный коллектив. Если вы хотите участвовать в амбициозных, социально значимых проектах по разработке и внедрению IT решений присоединяйтесь к нашей профессиональной команде!

Имя не указано

Откликнуться
Разместить Резюме
Пожаловаться ID: 123206840

Похожие вакансии

Стажер Data scientist (NLP)

Договорная

Санкт-Петербург

СБЕР

Middle Data Scientist (general+NLP)

Договорная

Санкт-Петербург

WaveAccess

Архитектор NLP

Договорная

Санкт-Петербург

Газпром нефть

Senior Data Scientist NLP в команду клиентского сервиса

Договорная

Санкт-Петербург

Газпромбанк

Инженер-аналитик (Data Science - NLP/LLMs)

Договорная

Санкт-Петербург

ГАЗИНФОРМСЕРВИС

ML Engineer/Data Scientist

Договорная

Санкт-Петербург

Oil and Gas Production Tools