Обязанности:
Привет! Я Артем Науменко, ex-Head of Infra Skyeng. Я прошел путь от разработчика до архитектора, потом до руководителя инфраструктуры и теперь до CTO. В Skyeng руководил командой из >50 человек. Теперь я занялся стартапом в области био технологий с продуктовой командой из 3 человек. Теперь я ищу middle fullstack разработчика (React+PHP) на фуллтайм, чтобы вместе менять будущее медицинских исследований. Откликайся если: ты энергичный человек и понимаешь как работают небольшие стартапы хочешь делать реально технически сложные решения разрабатывал комплексные системы для B2B больше любишь frontend, но и backend можешь регулярно развиваешь свои навыки программирования в теории и на практике хочешь прокачаться в архитектуре и ООП О Unison: - Мы строим инфраструктуру для создания крупнейших в мире генетических датасетов по редким болезням, используя федерацию данных. Федерация - это виртуальное объединение данных без физического копирования данных. Нормализация данных на лету (и это реально сложно). - Мы работаем с крупнейшим онкологическим датасетом в мире и некоторыми компаниями, находящимися на переднем крае точной медицины в онкологии с использованием ДНК конкреного пациента (персонализированная медицина). - Мы привлекли инвестиции лучших венчурных фондов Европы: на 4м, 7м и 8м местах среди по доле единорогов. О продукте: - Наша цель одновременно простая и сложная. Хотим чтобы исследователи имели простой доступ к данным для исследований, чтобы получать инсайты быстрее. Таким образом исследователи смогут сосредоточиться на новых методах лечения и новых видах лекарств. - Суть проекта: сделать возможными исследования генетических данных нескольких биобанков одновременно, при условии что эти данные нельзя копировать (нельзя собрать в одном биобанке, например). - Суть решения: федеративные исследования. Мы запускаем внутри каждого биобанка процесс, который генерирует анонимизированные данные, полезные для данного исследования, и эти агрегаты уже экспортируем наружу в общее хранилище данных, где исследователь может их анализировать. Кардинально упрощенный пример: исследователь спрашивает "нарисуй мне распределение по пациентов определенного пола и возраста, больных раком легких с диабетом 1-го типа", и система возвращает график, но сами личности этих пациентов не раскрываются. На самом деле все супер сложнее, так как анализ геномов не выражается через SQL. Кто нам нужен: - Senior fullstack developer (PHP+react). - Python будет плюсом (агенты, устанавливаемые в биобанки, на python). - OOP, SOLID. - Желательно знание английского B2 и выше, так как все сотрудники вне разработки англоязычные. Основные челленджи: - Безопасность. Биобанки - параноики. Все что хоть немного небезопасно они отвергают. Можешь сам подумать как дедублицировать базу пациентов между разными биобанками, без передачи каких либо идентификаторов человека между биобанками. - Объемы данных. Один геном человека весит 2Gb. Для исследования нужно работать с тысячами геномов одновременно. Речь про гиганские кластеры (HPC), и в разных биобанках кластера разные (где-то k8s, где-то slurm, где-то AWS Batch и т.д.) - Стандартизация данных. В каждом биобанке своя структура данных и нужно архитектурно поддерживать их совместимость с нашим унифицированным языком запросов UQL. - Верификация результата. Недостаточно сделать условный генератор графика распределения по возрастам для разных биобанков, нужно еще гарантировать, что это распределение построено правильно. Соответственно нужны тесты на данные и на аггрегаты. Технологии: - Web: PHP8, symfony, react, PostgreSQL, Websockets. - Biobank app: python. - Nextflow. - AWS Batch, k8s (EKS). - Практически нет легаси, нам 2 года Условия: - Удаленная работа. - Договор с UK-компанией. - Зарплата в $ - обсудим твои ожидания на собеседовании. - Возможно получение опционов (доли компании) - Потенциально возможна релокация в Лондон.