Обязанности:
Диалоговые Системы - команда, занимающаяся разработкой диалогового ассистента для подбора товаров на МегаМаркет; Наша цель - создание умного помощника, который помогает миллионам пользователей находить и выбирать товары, максимально удовлетворяя их потребности; Сейчас мы ищем опытного аналитика-разработчика для работы с данными, анализа пользовательского взаимодействия и оптимизации работы ассистента. Чем нужно будет заниматься: ETL-процессами: проектирование и разработка ETL-процессов, включая очистку и нормализацию данных, создание витрин данных и feature engineering; Анализом данных: работа с большими объемами структурированных и неструктурированных данных, таких как тексты диалогов, метаданные сеансов и логи системы; Проведением А/В-тестов: разработка и проведение экспериментов для оценки нового функционала ассистента, анализ результатов с применением статистических тестов; Взаимодействием с Data Science командой: плотная работа с коллегами для улучшения моделей и алгоритмов, используемых в работе ассистента. В перспективе - заниматься ML решениям для продвинутого анализа диалоговых данных: анализ тональностей, извлечение ключевых фраз и тем, кластеризация диалогов, автоматическое обнаружение аномалий, определение подгрупп клиентов на основе их предпочтений и поведения, разработка стратегий для каждой из групп; Что мы ждем от тебя: Уверенные знания Python: опыт работы с библиотеками анализа данных (Pandas, Pyspark, scikit-learn); Продвинутые знания SQL: опыт работы с реляционными базами данных (Postgres, ClickHouse, GreenPlum, Hadoop); Опыт работы с ETL: умение проектировать и оптимизировать процессы извлечения, трансформации и загрузки данных; Знания в области А/Б-тестирования: понимание принципов проведения тестов и анализа их результатов. Будет плюсом: Знания в области NLP и Classic ML (transformers, word2vec, topic modelling, scikit-learn);