Наши преимущества

Что умеет наш парсер/грабер

Наш парсер/грабер является уникальным, так как он:

  1. Умеет обходить любую блокировку IP адреса;
  2. Может эмулировать 42 основных и 117 дополнительных User-Agent’ов броузеров (в том числе и мобильных устройств);
  3. Может эмулировать 13 основных и 18 дополнительных User-Agent’ов поисковых пауков;
  4. Имеет настроенный и протестированный функционал;
  5. Производит парсинг/грабинг очень быстро за счет использования параллельных процессов, промежуточных серверов и сжатия трафика.

И это всего лишь малая часть его возможностей. Да и перечислять их просто нет смысла. Лучше попробовать!

Архитектура

Преимущество нашего парсера/грабера проявляется даже в его архитектуре. Рассмотрим на примерах.

Классическая архитектура, которой пользуются постоянно, имеет следующий вид:

Классическая структура грабера

У этой архитектуры есть только одно преимущество:

  • Простота и скорость реализации.

Однако недостатков она имеет целый ряд:

  • В случае блокировки IP адреса на сервере-обьекте грабинг будет невозможным;
  • Грабинг/парсинг по подобной схеме создает высокую временную нагрузку на сервер-обьект (что очень хорошо видно администратору);
  • Скорость грабинга/парсинга не высокая и увеличить ее без изменения архитектуры достаточно сложно.

Даже если в данной архитектуре используется прокси-сервер, то он легко блокируется на сервере-объекте, что заставляет разработчика либо искать новый прокси, либо строить сложную цепочку динамически изменяемых прокси (что само по себе достаточно сложно и затратно по времени).

В свою очередь наш грабер/парсер в своей работе использует более развитую архитектуру:

Структура нашего грабера

Подобная архитектура лучше, потому что:

  • Заблокировать IP адрес невозможно, так как сервер-обьект видит IP адрес только промежуточного сервера. В качестве промежуточного сервера может использоваться любой сайт с установленным небольшим скриптом.
  • Скорость грабинга/парсинга увеличивается за счет того, что промежуточный сервер выступает в качестве фильтра. То есть промежуточный сервер передает нашему серверу не всю информацию, а только определенные блоки. Также промежуточный сервер производит gz сжатие информации, что также ускоряет процес обработки.

Данная архитектура развивалась и оттачивалась в течении долгого времени, потому что наша компания ориентируется на долгосрочные проекты, а не на разовый “фриланс”.

Команда

Но главным преимуществом, как всегда, являются кадры. И у нас они самые лучшие!

Среди наших профессионалов ВСЕ имеют опыт программирования не менее 5 лет, а также обладают идеальным знанием сетевых технологий. Поэтому вы можете не переживать за качество выполненной нами работы.