Яндекс ТИЦ

Иногда нам (веб-разработчикам и веб-оптимизаторам) нужно получить скриптом (потому что сервисов, которые это делаю за нас просто немеряно) такой параметр страницы как ТИЦ.

Введен этот чудный параметр был компанией Яндекс, поэтому все дружно его и называют Яндекс ТИЦ.

Для его нахождения я использую следующий простой скрипт:

function GetTCY($url) {		
   $url="http://bar-navig.yandex.ru/u?ver=2&show=32&url=".$url;
   $Result=file_get_contents($url);		
   return $Result ? (int) substr(strstr($Result, 'value="'), 7) : false;
}

Этой функции вы можете скармливать URL любого сайта, чей ТИЦ вы хотите узнать.

Данный метод основан на том же принципе, что и Яндекс.Бар.

Если вы уже очень любознательны, то в ответ на наш запрос Яндекс возвращает XML файл следующего вида:

<?xml version="1.0" encoding="windows-1251" ?>
<urlinfo>
 <url domain="www.net-safari.com"><![CDATA[/]]></url>
 <tcy rang="2" value="20"/>
 <topics>
 </topics>
 <textinfo>
 </textinfo>
</urlinfo>

Также вы можете скачать данный код в готовом виде отсюда.

Кстати по поводу лимита на количество запросов для данного кода ничего не известно, так что если кто эксперементальным путем установить на каком уровне находится данный лимит, то прошу сообщить. Интересно.

Дополнительные сведения:

7 комментариев

  1. eraser:

    http://bar-navig.yandex.ru/u?ver=2&show=32&url=google.com

    не работает чегото выдача :( выдает пустой xml

  2. admin:

    Вы немного ошиблись с синтаксисом.
    Правильно так указывать:
    http://bar-navig.yandex.ru/u?ver=2&show=32&url=http://www.google.com
    Тогда выдает ТИЦ = 43 000
    Для моего кода надо указывать полный URL.

    Удачи.

  3. eraser:

    спасибо :)

  4. admin:

    Всегда рад помочь!

  5. eraser:

    нашел темку эту снова :) тестил я этот скрипт… примерно на 2ой тысяче запросов яндекс банит… только еще не выяснил на сколько :)

  6. eraser:

    еще я выяснил, что парсить нужно такой url:

    http://bar-navig.yandex.ru/u?ver=2&url=http://google.com&show=1

  7. admin:

    Понятное дело, что Яндекс банит :))) Он и на парсинге поиска тоже банит, и на других видах тоже :)))
    На сколько банит известно - на одни сутки. Завтра сможете начинать все сначала. Если поставите интервал между запросами в районе 2-3 секунд, то сможете до 10 000 сайтов обработать.
    По поводу того какой урл парсить - это уже разницы нет.

Оставить комментарий