<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress/2.2.3" -->
<rss version="2.0" 
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	>
<channel>
	<title>Comments on: Уйти от скриптов?</title>
	<link>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/</link>
	<description>Профессиональный парсинг/граббинг/сбор информации</description>
	<pubDate>Thu, 08 Jan 2009 11:32:22 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.2.3</generator>

	<item>
		<title>By: admin</title>
		<link>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-156</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Sun, 02 Mar 2008 07:48:08 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-156</guid>
		<description>&lt;blockquote&gt;Если заказ на 1 источник, то “узкое место”, как правило собвстенно сайт-донор и нет смысла писать на C++ (если только сайт не хоститься на ферме серверов).&lt;/blockquote&gt;
А на чем вы еще пишите? На пхп? Притом сайтов, которые имеют кластерное построение ОЧЕНЬ МАЛО :)
&lt;blockquote&gt;К сожалению, 100 % лекарства нет, есть некоторые хитрости как “разгрузить” донора, но это все равно не панацея (поискать зеркала, собирать страницы не с источника а кеша поисковиков или веб-архивов и т.д.) у них есть свои недостатки.&lt;/blockquote&gt;
Кстати, кстати. Я пишу сейчас небольшую статью о методах разгрузки сайта-донора и мне было бы очень приятно выслушать ваше мнение по данному вопросу. Какие-то более хитрые уловки нежели просто зеркала и кеши? Я, например, очень часто использую селективные http запросы, лимитирую длину получаемого контента, использую граббинг PDA версий сайта, емейл рассылки и много прочего. Чем пользуетесь вы?</description>
		<content:encoded><![CDATA[<blockquote><p>Если заказ на 1 источник, то “узкое место”, как правило собвстенно сайт-донор и нет смысла писать на C++ (если только сайт не хоститься на ферме серверов).</p></blockquote>
<p>А на чем вы еще пишите? На пхп? Притом сайтов, которые имеют кластерное построение ОЧЕНЬ МАЛО <img src='http://www.parse.com.ua/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<blockquote><p>К сожалению, 100 % лекарства нет, есть некоторые хитрости как “разгрузить” донора, но это все равно не панацея (поискать зеркала, собирать страницы не с источника а кеша поисковиков или веб-архивов и т.д.) у них есть свои недостатки.</p></blockquote>
<p>Кстати, кстати. Я пишу сейчас небольшую статью о методах разгрузки сайта-донора и мне было бы очень приятно выслушать ваше мнение по данному вопросу. Какие-то более хитрые уловки нежели просто зеркала и кеши? Я, например, очень часто использую селективные http запросы, лимитирую длину получаемого контента, использую граббинг PDA версий сайта, емейл рассылки и много прочего. Чем пользуетесь вы?</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Andrey</title>
		<link>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-155</link>
		<dc:creator>Andrey</dc:creator>
		<pubDate>Fri, 29 Feb 2008 07:04:12 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-155</guid>
		<description>Если заказ на 1 источник, то "узкое место", как правило собвстенно сайт-донор и нет смысла писать на C++ (если только сайт не хоститься на ферме серверов).
К сожалению, 100 % лекарства нет, есть некоторые хитрости как "разгрузить" донора, но это все равно не панацея (поискать зеркала, собирать страницы не с источника а кеша поисковиков или веб-архивов и т.д.) у них есть свои недостатки.</description>
		<content:encoded><![CDATA[<p>Если заказ на 1 источник, то &#8220;узкое место&#8221;, как правило собвстенно сайт-донор и нет смысла писать на C++ (если только сайт не хоститься на ферме серверов).<br />
К сожалению, 100 % лекарства нет, есть некоторые хитрости как &#8220;разгрузить&#8221; донора, но это все равно не панацея (поискать зеркала, собирать страницы не с источника а кеша поисковиков или веб-архивов и т.д.) у них есть свои недостатки.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: admin</title>
		<link>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-147</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Wed, 27 Feb 2008 07:18:00 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-147</guid>
		<description>А если заказ только на 1 источник? :))
Сервер бд упадет и при 20 потоках и на перловом / пхппешном граббере. Так что это не показатель. И как вы с подобными проблемами боретесь, кста?</description>
		<content:encoded><![CDATA[<p>А если заказ только на 1 источник? :))<br />
Сервер бд упадет и при 20 потоках и на перловом / пхппешном граббере. Так что это не показатель. И как вы с подобными проблемами боретесь, кста?</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Andrey</title>
		<link>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-145</link>
		<dc:creator>Andrey</dc:creator>
		<pubDate>Sun, 24 Feb 2008 08:43:33 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-145</guid>
		<description>Мы делаем серверные приложения, и грабим как правило не 1 источник, по жтому узкое место либо канал либо ресурсы. Если запустить даже на 10Mb/s C++ граббер на средниый сайт, то он проработает секунды 3 (на 100 потоков), потому упадет сервер БД.</description>
		<content:encoded><![CDATA[<p>Мы делаем серверные приложения, и грабим как правило не 1 источник, по жтому узкое место либо канал либо ресурсы. Если запустить даже на 10Mb/s C++ граббер на средниый сайт, то он проработает секунды 3 (на 100 потоков), потому упадет сервер БД.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: admin</title>
		<link>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-142</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Fri, 22 Feb 2008 07:49:55 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-142</guid>
		<description>Но как я понимаю при работе на С++ также сложно проходит и процесс отладки. Потому что это уже компилиремый язык в отличии от общераспространенных интерпритируемых скриптов.
И как понять "узкое место перемещается на канал"? Предположим у меня гигабитный инет. Так вот я уверен, что при максимальной скорости и прочих благоприятных условиях узкое место переместится на сайт источник, потому что в инете (особенно в русском) не так много сайтов, которые могут отдавать динамические страницы (а чаще всего именно они и собираются) с большой скоростью.</description>
		<content:encoded><![CDATA[<p>Но как я понимаю при работе на С++ также сложно проходит и процесс отладки. Потому что это уже компилиремый язык в отличии от общераспространенных интерпритируемых скриптов.<br />
И как понять &#8220;узкое место перемещается на канал&#8221;? Предположим у меня гигабитный инет. Так вот я уверен, что при максимальной скорости и прочих благоприятных условиях узкое место переместится на сайт источник, потому что в инете (особенно в русском) не так много сайтов, которые могут отдавать динамические страницы (а чаще всего именно они и собираются) с большой скоростью.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Andrey</title>
		<link>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-141</link>
		<dc:creator>Andrey</dc:creator>
		<pubDate>Fri, 22 Feb 2008 07:07:31 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-141</guid>
		<description>Не сравнивали, т.к. не пишем на перле, да и на C многопоточность можно реализовывать по-разному (зачастую простого мултикурла хватает для решения задачи). 
При работе с С узкое место перемещается на канал (если есть прокси то на них).</description>
		<content:encoded><![CDATA[<p>Не сравнивали, т.к. не пишем на перле, да и на C многопоточность можно реализовывать по-разному (зачастую простого мултикурла хватает для решения задачи).<br />
При работе с С узкое место перемещается на канал (если есть прокси то на них).</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: admin</title>
		<link>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-139</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Fri, 22 Feb 2008 06:49:32 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-139</guid>
		<description>А какой выигрыш по скорости мы получим, например, при переходе с PERL POE на C++ событийные машины и ее (сишную) реализацию многопоточности??? Это главный вопрос!</description>
		<content:encoded><![CDATA[<p>А какой выигрыш по скорости мы получим, например, при переходе с PERL POE на C++ событийные машины и ее (сишную) реализацию многопоточности??? Это главный вопрос!</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Andrey</title>
		<link>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-135</link>
		<dc:creator>Andrey</dc:creator>
		<pubDate>Thu, 21 Feb 2008 08:16:51 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-135</guid>
		<description>Все действительно требовательное к ресурсам/скорости делаем на C(++).

+ работает на любом выделенном сервере/vps
- как правило требуется установка доп. библиотек</description>
		<content:encoded><![CDATA[<p>Все действительно требовательное к ресурсам/скорости делаем на C(++).</p>
<p>+ работает на любом выделенном сервере/vps<br />
- как правило требуется установка доп. библиотек</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: admin</title>
		<link>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-131</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Mon, 18 Feb 2008 06:58:28 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-131</guid>
		<description>Мне тут просто один многоуважаемые "про" усердно рассказывал, что "все" высоконагруженные системы (к которым также относится и парсинг) надо писать на C#.</description>
		<content:encoded><![CDATA[<p>Мне тут просто один многоуважаемые &#8220;про&#8221; усердно рассказывал, что &#8220;все&#8221; высоконагруженные системы (к которым также относится и парсинг) надо писать на C#.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Anarki</title>
		<link>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-121</link>
		<dc:creator>Anarki</dc:creator>
		<pubDate>Tue, 12 Feb 2008 16:35:02 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/25/ujti-ot-skriptov/#comment-121</guid>
		<description>Ну C# явно врядли подойдет, ибо платформы нужны соответствующие Mono или .NET, а они тормозные и их еще устанавливать дополнительно нужно.</description>
		<content:encoded><![CDATA[<p>Ну C# явно врядли подойдет, ибо платформы нужны соответствующие Mono или .NET, а они тормозные и их еще устанавливать дополнительно нужно.</p>
]]></content:encoded>
	</item>
</channel>
</rss>
