Получаем от Google больше 1000 ссылок
Статистика назойливо показывает, что на мой сайт каждый день приходят посетители по запросу “больше 1000 ссылок в Google” и ему подобным. Поэтому я решил вынести тему получения более 1000 ссылок в выдаче Google в отдельный пост.
Итак. Есть следующие основные пути получения в выдаче более 1000 сайтов:
- Использование дополнительного оператора (иногда еще называют модификатора) site.
Расскажу как можно это использовать на простом примере.Например вам надо собрать 5 000 ссылок по запросу “sex” (первое что пришло в голову).
Тогда вы можете составить следующий список запросов для выполнения своим парсером:
sex site:com
sex site:org
sex site:net
sex site:info
sex site:bizЭто соберет все сайт, в чьих доменных именах есть слово sex и которые принадлежат к зоне com, net, org, info и biz. Если же надо собрать все сайты, которые просто содержат это слово и принадлежат к вышеуказанным доменам, то надо выполнить следующие запросы (сделать небольшую перестановку):
site:com sex
site:org sex
site:net sex
site:info sex
site:biz sexИ в результате распарсив выдачу Гугла вы получите желанные 5 000 ссылок.
Также на некоторых форумах я видел новомодный метод сбора только доменных имен с “-” в имени. Для нашего запроса он будет имеет следующий вид:
sex site:com -site:*com
Данный запрос соберет все домены, у которых в имени есть слово sex и “-” (тире). Однако люди занимающиеся SEO знают, что домены с тире в имени попадают под некоторые определенные фильтры Гугла, что само по себе понижает их ценность. Но если уж слишком надо, то можно и таким запросом пользоваться.
Для получения всех сайтов, у которых в доменном имени есть тире и на которых упоминается про sex опять надо немного перекрутить запрос:
site:com -site:*com sex
При помощи подобных инструментов можно получить просто немерянно ссылок по практически любому запросу. Особенно ВЧ англоязычному.
Полный список доменных зон для подобных махинаций с запросами вы можете найти тут: ccTLD (региональные) | gTLD (general).
- Использование уточняющих слов.
Про это я уже детально рассказывал. Главное - просто добавляйте к своему запросу еще по уточняющему слову.
- Синонимизация.
Очень непростой и неоднозначный инструмент, которым, по моим наблюдениям, пользуются только некоторые профи.
Принцип действия данного метода достаточно простой. Собирается (или чаще всего покупается) база синонимов. Потом на основе этой базы делается замена слов в запросе на синонимы. Таким образом вы увеличивается массу собранных ссылок.
Хотя со своей стороны могу сказать, что я подобным методом не пользовался, так как при его использовании очень сложно контролировать качество выдачи. Понятное дело, если вам нужно насобирать базу каких-то досок или форумов для спама по определенной тематике, то вам абсолютно все равно какого качества идет выдача, но я, например, подобным не занимаюсь, а для статистических исследований качество выдачи имеет чуть-ли не главную роль.Поэтому советую оставить данный метод “про запас”.
- Танцы с бубном и прочими оператора (модификаторами) Гугла.
Это такой обобщенный метод. Используется в основном для сбора баз для спама, поэтому я расскажу о нем вкратце.Метод основан на использовании всевозможнейших операторов: inurl, intitle …
В основном спамеры используют запросы с inurl: script.php, что помогает им находить определенные движки, которые они умеют спамить. Но это совсем не интересно и не ко мне.
Дополнительная информация:
- ccTLD
- gTLD
- описание основных операторов (/модификаторов) запросов к Google
- Google Hacks (2nd Edition) (книга про всевозможнейшие трюки с запросами)

MANiac:
>site:com -site:*com
22 Февраль 2008, 3:05 дпМожно разъяснить этот запрос?
admin:
Можно. Получает в ответе все домены у которых в имени есть тире.
22 Февраль 2008, 9:52 дпПроверить можете на таком нехитром запросе к Гуглу: site:com - site:*com sex