Все статьиТехническое11 мин

Антибот-защита в 2026 году: как работают Cloudflare, DataDome и PerimeterX

Разбираем, как современные системы антибот-защиты обнаруживают скреперы: IP-репутация, TLS-отпечатки, JavaScript-челленджи, поведенческий анализ и fingerprinting устройств.

Команда InfraProxy

9 февраля 2026 г.

#антибот#Cloudflare#DataDome#TLS#fingerprinting

Эволюция антибот-защиты

Ещё пять лет назад для блокировки ботов достаточно было проверять IP-адрес и User-Agent. Сегодня антибот-системы — это сложные многоуровневые платформы с машинным обучением, которые анализируют десятки параметров одновременно. По оценкам экспертов, около 50% всего интернет-трафика генерируется автоматически, и примерно треть из этого — вредоносные боты.

Понимание того, как работает защита, критически важно для легального сбора публичных данных. Давайте разберём каждый уровень.

Уровень 1: IP-репутация

Самый базовый, но по-прежнему эффективный уровень защиты. Каждому IP-адресу присваивается «репутационный балл» на основе:

  • Тип IP: серверный (дата-центр) или резидентный (домашний провайдер). Серверные IP автоматически получают более низкий балл доверия.
  • История: были ли с этого IP зафиксированы подозрительные действия ранее.
  • Геолокация: совпадает ли расположение IP с типичным для данного сайта.
  • Плотность запросов: сколько запросов в секунду приходит с одного адреса.

Как обойти: использование резидентных прокси с ротацией IP-адресов. Резидентные IP принадлежат реальным провайдерам (Ростелеком, МТС, Билайн), поэтому имеют высокий балл доверия.

Уровень 2: TLS-отпечатки (TLS Fingerprinting)

Это один из самых мощных современных методов обнаружения. Когда браузер устанавливает HTTPS-соединение, он отправляет серверу так называемый «Client Hello» — начальное сообщение, в котором перечислены поддерживаемые шифры, расширения и протоколы.

Из этих данных формируется уникальный отпечаток — JA3-хеш (или его более новая версия JA4). Каждый браузер, каждая версия, каждая библиотека HTTP-клиента оставляет свой характерный отпечаток.

Как это работает на практике

  • Chrome 120 на Windows 11 имеет свой JA3-хеш
  • Python-библиотека requests — совершенно другой хеш
  • Если сервер видит хеш requests, но User-Agent заявляет «Chrome» — это мгновенная блокировка

JA3 vs JA4

Стандарт JA3 существует уже несколько лет, и скреперы научились его подделывать, перемешивая порядок расширений TLS. В ответ на это появился JA4, который сортирует расширения по алфавиту перед хешированием. Это делает подделку существенно сложнее.

Как обойти: использование полноценных headless-браузеров (Playwright, Puppeteer) или API для скрейпинга, которые используют реальные TLS-стеки браузеров.

Уровень 3: JavaScript-челленджи

Многие защитные системы вставляют невидимый JavaScript-код на страницу. Этот код выполняет проверки:

  • Наличие DOM-объектов: реальный браузер имеет window, document, navigator с сотнями свойств. Headless-браузер может не иметь некоторых из них.
  • Проверка WebGL и Canvas: рендеринг графических примитивов, результат которого уникален для каждой комбинации GPU + драйвер + ОС.
  • Измерение времени выполнения: автоматизированный браузер выполняет JavaScript иначе, чем реальный.

Cloudflare активно использует такие проверки — это те самые экраны «Checking your browser...», которые появляются на пару секунд перед загрузкой страницы.

Уровень 4: Поведенческий анализ

Самый сложный уровень для обхода. Современные системы отслеживают более 35 поведенческих сигналов:

  • Движения мыши: реальный пользователь двигает курсор нелинейно, с микрозадержками и плавными кривыми. Бот — прямыми линиями или вообще не двигает мышь.
  • Скорость прокрутки: человек скроллит неравномерно, останавливаясь на интересных блоках. Бот прокручивает страницу с постоянной скоростью.
  • Клавиатурный почерк: скорость набора, задержки между клавишами, ошибки и исправления.
  • Паттерн навигации: человек переходит между разделами непоследовательно, возвращается назад, проводит разное время на разных страницах.

DataDome особенно силён в поведенческом анализе — их ML-модель ловит ботов, которые прошли все технические проверки, но ведут себя «машинно».

Уровень 5: Fingerprinting устройства

Комбинирование множества параметров для создания уникального «отпечатка» браузера:

  • Разрешение экрана и глубина цвета
  • Установленные шрифты
  • Часовой пояс и языковые настройки
  • Плагины и расширения
  • Особенности рендеринга Canvas и WebGL
  • Объём оперативной памяти и число ядер CPU

Даже без cookies этот отпечаток позволяет идентифицировать устройство с высокой точностью. Если один и тот же «отпечаток» отправляет 500 запросов в минуту — это явно не обычный пользователь.

Как крупные системы используют эти уровни

Cloudflare

Использует комбинацию всех пяти уровней с акцентом на JavaScript-челленджах и ML-моделях, обученных на трафике конкретного сайта. У каждого клиента Cloudflare — своя модель, адаптированная под его аудиторию.

DataDome

Специализируется на поведенческом анализе в реальном времени. Принимает решение за 2 миллисекунды. Особенно эффективен против продвинутых ботов, которые научились имитировать технические параметры реального браузера.

PerimeterX (HUMAN Security)

Применяет «отложенное применение» — не блокирует подозрительного пользователя сразу, а позволяет ему просматривать сайт. Блокировка срабатывает только на критически важных действиях: оформление заказа, регистрация, отправка формы. Это затрудняет обнаружение самой защиты при тестировании.

Практические рекомендации

Для легального и эффективного сбора публичных данных:

  1. Используйте резидентные прокси — их IP-адреса имеют высокий уровень доверия у всех защитных систем.
  2. Ротируйте IP — не отправляйте более 5-10 запросов с одного адреса на один домен.
  3. Имитируйте реальный TLS-стек — используйте headless-браузеры или API, которые подставляют корректные TLS-отпечатки.
  4. Соблюдайте тайминг — добавляйте случайные задержки между запросами (2-7 секунд).
  5. Уважайте robots.txt — это не только этика, но и юридическая защита.

Как InfraProxy решает эти задачи

Прокси InfraProxy проходят через все уровни проверок, потому что используют IP-адреса реальных провайдеров с чистой репутацией. В сочетании со Scraper API от FineData вы получаете полный стек: надёжные прокси + обход защит + извлечение данных.

Нужна консультация по подбору прокси для вашего проекта? Оставьте заявку — поможем выбрать оптимальное решение.

Нужны надёжные прокси для вашего проекта?

InfraProxy предоставляет серверные и резидентные прокси для российского бизнеса. Договор, постоплата, техподдержка.