Обязанности:
Находимся в поиске Data Scientist (CV, OCR) Мы – РТК ИТ, аккредитованная ИТ компания, оказывающая полный комплекс услуг по разработке и внедрению программных решений. Каждый день на наших проектах задействовано 4200+ сотрудников, у нас 70+ направлений разработки различных решений. За 11 лет нашей работы мы успешно реализовали более 60 ИТ-продуктов. Проект - ядровой сервис по распознаванию документов. Мы предлагаем: - Удаленную работу с гибким началом рабочего дня (на территории РФ);- Оформление по ТК РФ в аккредитованной ИТ-компании;- Оклад и годовая премия;- Кафетерий льгот с возможностью выбора категорий (ДМС или компенсация затрат на медицинские услуги, спорт и т.д.). Вам предстоит: - Участвовать в разработке ядрового сервиса по распознаванию документов;- Заниматься распознаванием объектов, сегментацией и классификацией изображений;- Реализовывать OCR пайплайн для распознавания рукописного текста. Нам важны: - Опыт работы в роли Data scientist от 2 лет;- Реализация и работа с OCR решениями;- Знание основных подходов и метрик в OCR;- Наличие опыта решения классических задач CV (Detection, Segmentation, Classification и т.д.);- Опыт обучения с нуля/дообучения open-source/самописных моделей;- Владение: git, docker, pytorch, transformers и одним из фреймворков для OCR. Будет плюсом: - Участие в соревнованиях по ML/DL;- Практический опыт реализации OCR пайплайнов для распознавания рукописного текста, а также текстов на языках народов России (Татарский, Башкирский, Удмуртский и т.д.);- Опыт в парсинге и редактировании разных форматов текстовых документов через python (word, xlsx, pptx, pdf и т.д.)- Публикации по CV;- Опыт работы с VLLM, задачами трекинга, image description, Image question answering и т.д.;- Собственные проекты по CV.Похожие вакансии