<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress/2.2.3" -->
<rss version="2.0" 
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	>
<channel>
	<title>Комментарии на запись: Многопоточный парсер ТИЦ на Perl</title>
	<link>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/</link>
	<description>Профессиональный парсинг/граббинг/сбор информации</description>
	<pubDate>Mon, 06 Feb 2012 01:40:52 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.2.3</generator>

	<item>
		<title>От: nagual</title>
		<link>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3848</link>
		<dc:creator>nagual</dc:creator>
		<pubDate>Tue, 06 Jul 2010 19:12:07 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3848</guid>
		<description>Как заставить перл освобождать память занятую отработавшими тредами?</description>
		<content:encoded><![CDATA[<p>Как заставить перл освобождать память занятую отработавшими тредами?</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: admin</title>
		<link>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3161</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Wed, 05 Aug 2009 10:01:39 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3161</guid>
		<description>Согласен. Но это еще не повод, чтобы с ними не эксперементировать.</description>
		<content:encoded><![CDATA[<p>Согласен. Но это еще не повод, чтобы с ними не эксперементировать.</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: nagual</title>
		<link>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3158</link>
		<dc:creator>nagual</dc:creator>
		<pubDate>Wed, 05 Aug 2009 09:51:28 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3158</guid>
		<description>Треды пока что нестабильны ... и на многих машинах перл собран без них так что и поэкспериментировать неполучится ...</description>
		<content:encoded><![CDATA[<p>Треды пока что нестабильны &#8230; и на многих машинах перл собран без них так что и поэкспериментировать неполучится &#8230;</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: admin</title>
		<link>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3154</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Wed, 05 Aug 2009 09:25:35 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3154</guid>
		<description>Помогает. Но каждую задачу можно решить как минимум двумя путями. Вы назвали второй, я - первый ;)</description>
		<content:encoded><![CDATA[<p>Помогает. Но каждую задачу можно решить как минимум двумя путями. Вы назвали второй, я - первый <img src='http://www.parse.com.ua/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /></p>
]]></content:encoded>
	</item>
	<item>
		<title>От: nagual</title>
		<link>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3140</link>
		<dc:creator>nagual</dc:creator>
		<pubDate>Tue, 28 Jul 2009 13:41:11 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3140</guid>
		<description>А что РОЕ непомогает? и без всяких тредов ...</description>
		<content:encoded><![CDATA[<p>А что РОЕ непомогает? и без всяких тредов &#8230;</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: admin</title>
		<link>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3073</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Tue, 26 May 2009 16:29:57 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3073</guid>
		<description>У каждого процесса есть свой pid (process id), а у потока - нет. Поэтому любое приложение порождающее процессы называется многопроцесовым, а не многопоточным. И это даже близко не эмуляция многопоточности.</description>
		<content:encoded><![CDATA[<p>У каждого процесса есть свой pid (process id), а у потока - нет. Поэтому любое приложение порождающее процессы называется многопроцесовым, а не многопоточным. И это даже близко не эмуляция многопоточности.</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Гвоздь</title>
		<link>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3072</link>
		<dc:creator>Гвоздь</dc:creator>
		<pubDate>Tue, 26 May 2009 16:18:59 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3072</guid>
		<description>&#62;&#62;&#62;
У пхп нет нормального механизма реализации многопоточности, кроме всяких хитростей наподобии неблокирующих сокетов и т.п.
&#62;&#62;&#62;
неблокирующие сокеты и multiCURL
это только для запросов. с их же помощью можно создать новый процесс скрипта, что является продолжением темы многопоточности
это из того, что имеет распространение.
вроде есть еще пара методов, но они малораспространены и для их работы нужно поднимать VPS, потому что они являются каким-то довольно нестандартным расиширением. по крайней мере бинарников под венды в архиве PHP нету

для дела парсинга этих эмуляций многопоточности вполне достаточно, ИМХО</description>
		<content:encoded><![CDATA[<p>&gt;&gt;&gt;<br />
У пхп нет нормального механизма реализации многопоточности, кроме всяких хитростей наподобии неблокирующих сокетов и т.п.<br />
&gt;&gt;&gt;<br />
неблокирующие сокеты и multiCURL<br />
это только для запросов. с их же помощью можно создать новый процесс скрипта, что является продолжением темы многопоточности<br />
это из того, что имеет распространение.<br />
вроде есть еще пара методов, но они малораспространены и для их работы нужно поднимать VPS, потому что они являются каким-то довольно нестандартным расиширением. по крайней мере бинарников под венды в архиве PHP нету</p>
<p>для дела парсинга этих эмуляций многопоточности вполне достаточно, ИМХО</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: admin</title>
		<link>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3069</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Tue, 26 May 2009 15:38:15 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3069</guid>
		<description>У пхп нет нормального механизма реализации многопоточности, кроме всяких хитростей наподобии неблокирующих сокетов и т.п. 
По поводу скорости я с вами согласен. Все быстро можно сделать на пхп и еще раз повторяю, что этот скрипт на перл был закинут просто для затравки и не более ;)</description>
		<content:encoded><![CDATA[<p>У пхп нет нормального механизма реализации многопоточности, кроме всяких хитростей наподобии неблокирующих сокетов и т.п.<br />
По поводу скорости я с вами согласен. Все быстро можно сделать на пхп и еще раз повторяю, что этот скрипт на перл был закинут просто для затравки и не более <img src='http://www.parse.com.ua/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /></p>
]]></content:encoded>
	</item>
	<item>
		<title>От: admin</title>
		<link>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3062</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Tue, 26 May 2009 15:14:39 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3062</guid>
		<description>Выше в комментах есть подсказки на решение.</description>
		<content:encoded><![CDATA[<p>Выше в комментах есть подсказки на решение.</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Гвоздь</title>
		<link>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3056</link>
		<dc:creator>Гвоздь</dc:creator>
		<pubDate>Mon, 25 May 2009 21:09:47 +0000</pubDate>
		<guid>http://www.parse.com.ua/2008/01/26/mnogopotochnyj-parser-tic-na-perl/#comment-3056</guid>
		<description>&#62;&#62;&#62;&#62;&#62;
 На моем компе проверку 100 URL он произвел за 220 секунду, то есть по 2 секунды на адрес - ОЧЕНЬ МЕДЛЕННО!
&#62;&#62;&#62;&#62;&#62;
а почему так медленно-то?
я не так давно писал на PHP многопоточный парсер ТИЦ и ЯК
работал он в 100 потоков
на моей машине эта куча отрабатывала менее чем за 7 секунд, гарантировано.
на хостинге за 0.1-0.2 секунды в среднем, а то и сотые секунды
из-за большого выставленного таймаута, один поток мог затормозить процесс до 3секунд на 100 URL-ов
что замечательно, что этот URL для чекинга не банится яндексом, по количеству запросов.</description>
		<content:encoded><![CDATA[<p>&gt;&gt;&gt;&gt;&gt;<br />
 На моем компе проверку 100 URL он произвел за 220 секунду, то есть по 2 секунды на адрес - ОЧЕНЬ МЕДЛЕННО!<br />
&gt;&gt;&gt;&gt;&gt;<br />
а почему так медленно-то?<br />
я не так давно писал на PHP многопоточный парсер ТИЦ и ЯК<br />
работал он в 100 потоков<br />
на моей машине эта куча отрабатывала менее чем за 7 секунд, гарантировано.<br />
на хостинге за 0.1-0.2 секунды в среднем, а то и сотые секунды<br />
из-за большого выставленного таймаута, один поток мог затормозить процесс до 3секунд на 100 URL-ов<br />
что замечательно, что этот URL для чекинга не банится яндексом, по количеству запросов.</p>
]]></content:encoded>
	</item>
</channel>
</rss>

