Обязанности:
Привет! Мы команда Туту. У нас сервис путешествий, мы каждый день отправляем флот самолётов, несколько поездов и много автобусов. В компании 790 человек, из них около 300 — ИТ. С учётом количества людей, у нас много команд меняются данными через инфраструктурную платформу. Есть команда, которая делает эту инфраструктуру и инструменты. Инструменты они отдают в продуктовые команды и говорят: “вот вам молоток, пользуйтесь". Продуктовые команды берут инструменты и начинают ими пользуются. Иногда мы на это смотрим и плачем, потому что молотком очень тяжело закручивать шурупы. А данным в результате нельзя верить местами, потому что где-то команда не следит за багами, где-то не понимает, чья зонаответственности и так далее. Собственно, вам предстоит войти в новую команду качества данных, которая будет помогать всё это держать в порядке. Это что-то вроде третьей линии поддержки по данным. Задач бывает два типа: — Хорошие, когда заранее понятно, что сделать. Вы с бизнесом определяете требования к качеству данных, дальше всё это собирается. Например, если с 4 продуктов надо собрать данные о продажах, вы помогаете организовать эти 4 потока и настраиваете проверки, и убеждаетесь, что до каждого потока доезжает всё нужное. — Поинтереснее, когда уже что-то сделали, аналитик делает задачу, а в данных вдруг сюрприз. Причём от кого этот сюрприз и в чьей зоне ответственности — непонятно. В этом месте вы становитесь детективом и начинаете по логам выслеживать, что же портит данные. А потом описываете проблему и передаете в команду, которая будет её решать. Ведёте задачу до починки менеджер процесса в службе качества. Если нет текущих инцидентов и новых проектов, есть время делать дашборды и внутренние инструменты слежения за качеством потоков. Стек — SQL, REST, Confluence, Jira, Miro. — Хранилища, используемые в компании: ClickHouse, PostgreSQL, MySQL, ElasticSearch, MongoDb. — Шина данных на основе Kafka. — В качестве BI-инструмента для бизнес-пользователей используется Metabase. — Для визуализации и работы с техническими метриками и логами используем Grafana + Kibana. — Данные порождаются в 1000+ сервисах и в монолите, которые работают в нашем внутреннем облаке на OpenShift или на docker-хостах. От вас нужно — Опыт работы в роли, требующей работы с большими объёмами данных на схожем стеке от 1 года в любой сфере. — Знание SQL (предпочтительно ClickHouse). — Python на уровне работы с Dataframe Pandas и построение визуализаций в Plotly. — Опыт работы с BI-инструментом (любой). — Опыт презентации результатов работы и визуализации результатов. — Умение мыслить и находить в большом объёме неструктурированной информации зависимости и закономерности. — Готовность освоить новые инструменты: BI: Grafana, Metabase, Kibana. Написание запросов к хранилищам: Elasticsearch, MongoDB, Prometheus, MariaDB, PostgreSQL. Про команду и рабочий процесс Команда новая и только собирается. Сейчас в команде два человека: руководитель и владелец процесса работы с инцидентами. Задачи предварительно формулируются руководителем/владельцем процессов или приходят от пользователей через задачи в Jira. Планируются спринты, проводится уточнение требований и деталей, важных для оценки задачи, у постановщика и заказчика. Набор проектов/больших целей фиксируется на квартал, бьётся на спринты, планы по спринтам обсуждаются раз в неделю. По задачам, которые попали в спринт: пишется план по задачам, обсуждаются с командой, а выводы фиксируются в Confluence и обсуждаются с командой при необходимости. На текущей стадии происходит взаимодействие и с аналитиками данных, которые пользуются данными, и с разработчиками команд. 15–30-минутные стендапы каждый день, ретро по проектам или большим задачам. Задачи проходят review, если это код/дашборд или решение на более чем полгода. Проводим демо, если было что-то важное для более чем двух пользователей данных/заказчиков. График работы Есть полная удалёнка, работа из офиса или посещение офиса когда захочется. Это как вам удобнее. Про компанию — Компания с хорошим техническим стеком, техруководителями и готовностью одними из первых пробовать новые технологии. — Сильный блог на Хабре, где пишут в том числе технари о своей работе. — Хорошая техническая инфраструктура, очень крутая внутренняя база знаний, культура API и так далее. — Открываются новые направления, где можно делать всё с нуля. Весь положенный набор плюшек: ДМС со стоматологией, кухня в офисе, страховка на путешествия, ноутбук, премии по результатам работы, оплата больничных, регулярная переиндексация зарплаты, а также обучение, премия за прочитанные книги и обмен опытом. Структура собеседований — Пройти HR-менеджера, 30–40 минут. Никаких «кем вы видите себя через 5 лет». — Встреча с парой техспецов. Можно понять, достаточно ли профессиональна наша команда и комфортно ли вам с ней будет. Мы в свою очередь проверим ваши профессиональные знания и навыки ;) — Финальная встреча с командой и её руководителем.