Data Engineer (Python/Django/ML)

28 апреля 2026

З/П не указана

Город: Москва. Станции метро: Алексеевская, Рижская

Hello, Doc!

Город: Москва. Станции метро: Алексеевская, Рижская

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

Hello, Doc!

Тип занятости: Удаленная работа

Требуемый опыт: Опыт от 3 лет

"Hello, Doc!" (hellodoc.app) — активно развивающаяся компания в сфере онлайн медицины. С начала 2019 года мы занимаемся развитием мобильных приложений для врачей и пациентов, чтобы сделать их общение эффективным и удобным, а доступ к медицинским услугам доступным и понятным. Сегодня это уже более 400 000 пациентов и более 30 000 профи. Мы ищем активного, целеустремлённого разработчика, который хочет расти и развивать online медицину вмести с нами. Обязанности: Построение и оптимизация Data Pipeline: Проектирование и поддержка ETL/ELT-процессов в Yandex Cloud (Airflow, S3). Организация хранения данных: работа с PostgreSQL (операционные данные) и ClickHouse (аналитика, большие объёмы результатов). Автоматизация загрузки, очистки и нормализации разрозненных данных от партнёров и лабораторий — снижение доли ручной обработки с текущих 95%. Обеспечение целостности и консистентности данных при масштабировании (новые регионы, препараты, позиции). Работа с внешними данными и справочниками: Сбор данных из внешних источников: парсинг, фильтрация, валидация, обновление и хранение. Интеграция и поддержка актуальности внешних медицинских справочников: МКБ, справочники Минздрава, базы лабораторных исследований, реестры препаратов. Создание и поддержка маппинга между внутренними данными и внешними стандартами (18 000+ тестов и позиций). Мониторинг изменений во внешних источниках и своевременное обновление локальных витрин. Разработка логики и инструментов для продукта (MedTech): Структурирование медицинских данных для использования в продукте: связи «отклонение → рекомендация», «жалоба → чек-ап». Разработка внутренних инструментов на Django (Admin/Interface), позволяющих врачам и экспертам самостоятельно управлять правилами, справочниками и данными — без участия разработчиков. Реализация бизнес-логики для системы рекомендаций: автоматическое сопоставление результатов анализов с требованиями Минздрава и клиническими протоколами. Автоматизация формирования заказов и чекапов на основе выявленных закономерностей и правил. Поддержка ML и аналитики: Подготовка и витринизация данных для ML-моделей, экспертных систем и отчётности. Взаимодействие с командой ML и предметными экспертами (врачами) для перевода бизнес-требований в технические спецификации. Участие в разработке гибридных систем: экспертные правила + LLM/GPT (управление контекстом, подготовка базы знаний, контроль качества генерации). Архитектура и процессы: Переход от «файликов сопоставления» к централизованной, документированной логической модели данных. Самостоятельная проработка задач: трансформация размытых бизнес-пожеланий в конкретные, измеримые технические решения. Оптимизация запросов и затрат на инфраструктуру в Yandex Cloud. Документирование пайплайнов, справочников и бизнес-правил для передачи знаний внутри команды. Требования: Hard Skills: Уверенное знание Python (на уровне написания сложных скриптов, сервисов и фоновых задач). Опыт работы с Django (написание ад-панелей, CRUD-интерфейсов для внутренних инструментов). Глубокое знание SQL, опыт работы с PostgreSQL и колоночными БД (ClickHouse). Опыт оркестрации пайплайнов (Airflow). Опыт работы с облачными хранилищами (S3, предпочтительно Yandex Cloud). Понимание принципов построения DWH/Data Lake и витрин данных. Опыт и компетенции: Опыт работы в команде с ML-инженерами/дата-сайентистами (понимание жизненного цикла модели, подготовка фичей, верификация данных). Умение работать с неструктурированными или «грязными» данными, приводить их к единому стандарту. Опыт разработки инструментов автоматизации для бизнес-пользователей (чтобы они могли менять настройки и правила самостоятельно). Опыт работы с внешними источниками данных: парсинг, нормализация, поддержка актуальности. Способность работать в условиях неопределённости (задачи часто формулируются общими пожеланиями, нужна самостоятельность и проактивность). Будет плюсом: Опыт в MedTech / HealthTech (понимание терминов: МКБ, МИС, лабораторные анализы, клинические протоколы). Опыт внедрения правил бизнес-логики в код (Expert Systems, rule-based системы). Навыки работы с LLM/API (интеграция GPT/YaGPT для обработки текстов, генерации рекомендаций, управления контекстом). Опыт работы с медицинскими справочниками и нормативными источниками (Минздрав, ФФОМС, зарубежные базы). Условия: Что получите в работе: Возможность построить data-инфраструктуру «с нуля» в растущем MedTech-продукте. Реальное влияние на продукт: ваши решения напрямую ускорят работу врачей и повысят качество рекомендаций. Работу с интересными задачами на стыке данных, медицины и AI. Команду, которая ценит самостоятельность и нацелена на измеримый бизнес-результат. Удалённая занятость. График работы 5/2, с 10:00 до 19:00.

Показать контакты

Контакт:

Имя не указано

При звонке сообщите, что Вы нашли вакансию на Rabix.ru

Откликнуться

Разместить Резюме

Распечатать Пожаловаться ID: 152961405