Яндекс ТИЦ

Иногда нам (веб-разработчикам и веб-оптимизаторам) нужно получить скриптом (потому что сервисов, которые это делаю за нас просто немеряно) такой параметр страницы как ТИЦ.

Введен этот чудный параметр был компанией Яндекс, поэтому все дружно его и называют Яндекс ТИЦ.

Для его нахождения я использую следующий простой скрипт:

function GetTCY($url) {		
   $url="http://bar-navig.yandex.ru/u?ver=2&show=32&url=".$url;
   $Result=file_get_contents($url);		
   return $Result ? (int) substr(strstr($Result, 'value="'), 7) : false;
}

Этой функции вы можете скармливать URL любого сайта, чей ТИЦ вы хотите узнать.

Данный метод основан на том же принципе, что и Яндекс.Бар.

Если вы уже очень любознательны, то в ответ на наш запрос Яндекс возвращает XML файл следующего вида:

<?xml version="1.0" encoding="windows-1251" ?>
<urlinfo>
 <url domain="www.net-safari.com"><![CDATA[/]]></url>
 <tcy rang="2" value="20"/>
 <topics>
 </topics>
 <textinfo>
 </textinfo>
</urlinfo>

Также вы можете скачать данный код в готовом виде отсюда.

Кстати по поводу лимита на количество запросов для данного кода ничего не известно, так что если кто эксперементальным путем установить на каком уровне находится данный лимит, то прошу сообщить. Интересно.

Дополнительные сведения:

15 комментариев

  1. eraser:

    http://bar-navig.yandex.ru/u?ver=2&show=32&url=google.com

    не работает чегото выдача :( выдает пустой xml

  2. admin:

    Вы немного ошиблись с синтаксисом.
    Правильно так указывать:
    http://bar-navig.yandex.ru/u?ver=2&show=32&url=http://www.google.com
    Тогда выдает ТИЦ = 43 000
    Для моего кода надо указывать полный URL.

    Удачи.

  3. eraser:

    спасибо :)

  4. admin:

    Всегда рад помочь!

  5. eraser:

    нашел темку эту снова :) тестил я этот скрипт… примерно на 2ой тысяче запросов яндекс банит… только еще не выяснил на сколько :)

  6. eraser:

    еще я выяснил, что парсить нужно такой url:

    http://bar-navig.yandex.ru/u?ver=2&url=http://google.com&show=1

  7. admin:

    Понятное дело, что Яндекс банит :))) Он и на парсинге поиска тоже банит, и на других видах тоже :)))
    На сколько банит известно - на одни сутки. Завтра сможете начинать все сначала. Если поставите интервал между запросами в районе 2-3 секунд, то сможете до 10 000 сайтов обработать.
    По поводу того какой урл парсить - это уже разницы нет.

  8. Гвоздь:

    недавно сдал проект по этой теме
    ограничений не было замечено никаких
    за час с хостинга с одного IP было проверено 400к доменов.
    без бана

  9. admin:

    Да. Я тоже делал подобную проверку и также пришел к выводу, что при проверке ТИЦа нет проблем с количеством запросов.
    Спасибо за практическое подтверждение.

  10. Гвоздь:

    у меня тут возник вопрос:
    rang=”2″
    что это за величина?
    у меня сперва возникло предположение, что это google PR
    но, потом я убедился что значения отличаются
    http://www.google.com/search?client=navclient-auto&ch=6-1523326730&features=Rank&q=info:http://google.ru
    http://bar-navig.yandex.ru/u?ver=2&show=32&url=http://google.ru
    6 и 7 соответсвенно
    значит, это либо спарсенный яндексом устаревший PR, либо яндексовский показатель. какой именно тогда?
    заранее спасибо за ответ

  11. admin:

    Я не знаю, если честно. Сомневаюсь, что Яндекс собирает значения PR. Думаю это что-то другое.

  12. Зайва Игорь Леонидович:

    Никак не пойму как этот код работает, хотел полный пример скачать, а там 404… :(
    _http://parse.com.ua/files/yandex.zip

  13. admin:

    Я архив удалил. Но полный код один в один похож на тот, что в коде только еще с получением контента.

  14. Зайва Игорь Леонидович:

    Да, разобрался… дошло, что нужно было указать:

    echo GetTCY(site.ru)

    Спасибо. Нашел еще несколько примеров, почти таких же, но чуть иначе сделаных, например, вместо $url так:

    .urlencode(”http://”.$url));

    ну и другими хитрыми тегами, которых я еще не знаю, изучаю потихоньку эту пхп… :)

  15. admin:

    Это не теги, это функции.

Оставить комментарий