Обязанности:
Сегодня билайн — компания изменений, чутко реагирующая на потребности рынка и людей. А ещё билайн — это команда, объединённая общими ценностями и общей целью — быть лидером телеком и digital рынков, предоставляя нашим клиентам новейшие продукты и услуги, а также сервис самого высокого уровня. Сейчас у вас есть возможность присоединиться к лучшей команде по развитию антифрод продуктов в качестве Data-аналитика. Чем предстоит заниматься: Формировать выгрузки с помощью SQL-запросов, Python и Pyspark (основная часть данных лежит в Hadoop, но иногда приходится “заглядывать” в Postgres или S3). Работать с большими табличными и текстовыми данными. Строить графики (lineplot, scatterplot, hist), проводить тесты и подсчеты метрик для подтверждения ваших идей. Заниматься формированием, дизайном и анализом экспериментов, измерять эффект от внедряемых изменений. Проводить R&D для помощи датасаентистам в проверке продуктовых гипотез или улучшении существующих моделей при помощи продвинутых методов анализа (математической статистики, визуализации). Вот некоторые примеры конкретных задач, которые предстоит решать: Выяснить причину резкого падения/увеличения нежелательного трафика трафика с ХХ.ХХ.ХХХХ (сезонность? ошибка расчетов? появился новый крупный спамер? релиз другой команды в своем продукте?). Проанализировать причины оттока абонентов с услуги в зависимости от количества посланных им нотификаций. Провести анализ влияния “этикеток” на поведение звонящих номеров и номеров, которым они звонят. Написать прототип витрины для сбора подозрительных номеров или новых фичей. Проработать механизм сбора и обработки обратной связи (мнения) абонентов, получивших подозрительный вызов. Провести ревью существующих продуктовых дэшбордов, проверить, что они согласуются друг с другом, выглядят разумно (согласно нашим представлениям), предложить дополнительные графики. Мы будем рады рассмотреть вашу кандидатуру, если у вас есть: Коммерческий опыт в аналитике данных от 3-х лет. Продвинутый уровень владения SQL (виды джойнов, подзапросы, аналитические функции, оптимизация запросов, оконные функции) для работы с большими таблицами (от сотен миллионов до миллиардов записей). Умение и готовность разбираться в большом объеме информации, разных атрибутах, таблицах, базах данных и их особенностях. Умение достать нужные данные из разных систем под конкретную задачу, разобравшись во всех нюансах. Умение пристально глядеть в данные и искать у себя и других ошибки и несостыковки в выводах, логике, цифрах. Уверенное знание Python для анализа данных и визуализации (pandas, matplotlib, scipy). Уверенное знание теории вероятностей и математической статистики, понимание основ статистического тестирования. Будет плюсом: Владение инструментами Hadoop (PySpark, Hive). У нас огромный кластер на 30 ПБ и без инструментов BigData в билайне просто не выжить. Знание основ классического машинного обучения для табличных данных (понимание базовых алгоритмов кластеризации, деревьев решений, линейной регрессии, умение интерпретировать результаты). Чтобы быть на одной волне с датасаентистами. Опыт с Airflow, MLflow, Gitlab или аналоги. Что мы предлагаем: Трудоустройство в аккредитованную ИТ-компанию. Возможность работать дистанционно на территории РФ. Сплоченную команду профессионалов, в которой можно не только успешно реализовывать проекты, но и перенимать опыт и развиваться. Обучение, участие в интересных проектах и расширение профессиональной экспертизы: мы участвуем в конференциях, митапах, публикуемся на Хабр и т.д. Конструктивную и открытую рабочую атмосферу. Полис добровольного медицинского страхования, обслуживаемый в лучших клиниках. Корпоративные скидки на фитнес, обучение, путешествия и т.п. Служебную сотовую связь.