Обязанности:
На что будем смотреть в первую очередь: Опыт успешного создания парсеров под конкретные бизнес-задачи. Понимание специфики работы с большими объемами данных и анти-бот системами. Практические навыки работы с ключевыми технологиями (Python, BeautifulSoup, Scrapy, Selenium и т.д.). Умение структурировать и очищать полученные данные. Чем предстоит заниматься: Разработка, поддержка и оптимизация парсеров/краулеров/скраперов для сбора данных с веб-сайтов и API. Обход анти-бот защиты (CAPTCHA, блокировки по IP, JavaScript-рендеринг). Анализ структуры сайтов для извлечения необходимой информации. Обеспечение стабильности и надежности работы парсеров. Очистка, структурирование и преобразование собранных данных в пригодные для использования форматы (JSON, CSV, XML, БД). Интеграция процессов парсинга в существующую инфраструктуру компании (базы данных, облачные хранилища, аналитические системы). Написание технической документации. Что ждем от кандидата, требования: Обязательно: Опыт разработки парсеров на Python от 1 года. Глубокое знание фреймворков: Scrapy, BeautifulSoup, lxml, Requests. Опыт работы с Selenium/Playwright или аналогами для парсинга JavaScript-сайтов. Умение работать с базами данных (SQL, MySQL). Знание основных форматов данных: JSON, XML, HTML, XPath, CSS-селекторы. Понимание основ сетевых протоколов (HTTP/HTTPS, веб-сокеты). Условия и преимущества: Полная занятость с графиком работы 5/2 Возможность профессионального роста и развития ДМС с лучшими клиниками города и стоматологией полностью за счет компании.Похожие вакансии
Оператор MES систем / технолог машиностроения (ввод данных в базы данных)
От 85 000 руб.
Орел
ПРОХИМ