Обязанности:
Наши партнеры - небольшая компания, которая разрабатывает систему анализа Twitter-активности для генерации торговых сигналов (buy / sell) на криптовалютном рынке. Проект развивается поэтапно: Создание стабильного и масштабируемого Twitter-парсера Разработка алгоритмов сигналлинга на базе ML / LLM Бэктестинг стратегий и автоматизация торговли Проект технический, прикладной, с фокусом на реальные данные и работающие решения. Сейчас мы ищем Python / Data Engineer`а, который готов работать на стыке инфраструктуры и аналитики. Это стажировка (оплачиваемая) с перспективой перехода в полноценную роль. На старте - работа с существующим кодом и инфраструктурой.По результатам первых этапов и взаимного мэтча возможен переход в долгосрочное сотрудничество / фуллтайм-роль с дальнейшим обучением с нашей стороны. Не требуется быть экспертом во всем сразу - нам важно, чтобы у кандидата был опыт хотя бы в одном направлении: парсинг / data engineering / инфраструктура аналитика данных / ML / сигнальные модели Остальное можно дорастить в процессе :) Задачи: Twitter-парсер и инфраструктура Аудит и разбор существующего Python-кода Исправление багов, повышение стабильности Масштабирование системы: параллельный сбор данных запуск из нескольких Docker-инстансов Работа с авторизацией Twitter: cookies и auth-state ротация аккаунтов обход анти-бот ограничений Следующий этап проекта: Разработка алгоритмов buy / sell сигналов Анализ Twitter-активности и текста твитов Использование ML-моделей и LLM Бэктестинг стратегий Подготовка к автоматизации торговли Обязательные требования: Уверенное владение Python Опыт web scraping / parsing или data engineering Понимание параллельной обработки данных Опыт работы с Docker Git / GitHub Умение разбираться в чужом коде Будет плюсом: Опыт масштабирования парсеров и data-пайплайнов Работа с прокси, cookies, анти-бот защитами ML, feature engineering Работа с LLM (анализ текста, embeddings и т.п.) Опыт в крипто-домене Почему Вам это может быть интересно Вы будете работать с реальными рыночными данными, а не учебными датасетами Проект дает редкий опыт на стыке data engineering, ML и трейдинга При успешной стажировке возможен переход в полноценную оплачиваемую роль Участие в олимпиадах, хакатонах, исследовательских проектах или пет-проекты будет сильным преимуществом.Похожие вакансии