<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0"
					xmlns:content="http://purl.org/rss/1.0/modules/content/"
					xmlns:wfw="http://wellformedweb.org/CommentAPI/"
					xmlns:atom="http://www.w3.org/2005/Atom"
				  >
<channel>
<atom:link rel="self"  type="application/rss+xml"  href="http://rulinux.net/rss_from_sect_4_subsect_10_thread_42892"  />
<title>rulinux.net - Форум - Talks - А чем сейчас модно грабить сайты?</title>
<link>http://rulinux.net/</link>
<description><![CDATA[Портал о GNU/Linux и не только]]></description>
<image><title>rulinux.net - Форум - Talks - А чем сейчас модно грабить сайты?</title>
<link>http://rulinux.net/</link>
<url>http://rulinux.net/rss_icon.png</url>
</image>
<item>
<title>Re:А чем сейчас модно грабить сайты?</title>
<link>https://rulinux.net/message.php?newsid=42892&amp;page=1#220111</link>
<guid>https://rulinux.net/message.php?newsid=42892&amp;page=1#220111</guid>
<pubDate>Fri, 28 Apr 2017 15:05:47 +0300</pubDate>
<description><![CDATA[<p>Мне не надо миррор. Мне надо взять данные с сайта и положить в БД. И ещё надо чтобы в будущем если они затеют менять дизайн или защищаться от меня, мои действия были бы минимальными.</p>]]></description>
</item>
<item>
<title>Re:А чем сейчас модно грабить сайты?</title>
<link>https://rulinux.net/message.php?newsid=42892&amp;page=1#220107</link>
<guid>https://rulinux.net/message.php?newsid=42892&amp;page=1#220107</guid>
<pubDate>Fri, 28 Apr 2017 08:21:58 +0300</pubDate>
<description><![CDATA[<p>wget -m?</p>]]></description>
</item>
<item>
<title>А чем сейчас модно грабить сайты?</title>
<link>https://rulinux.net/message.php?newsid=42892&amp;page=1#220104</link>
<guid>https://rulinux.net/message.php?newsid=42892&amp;page=1#220104</guid>
<pubDate>Thu, 27 Apr 2017 19:33:59 +0300</pubDate>
<description><![CDATA[<p>Хочу тащить данные с одного сайта в свою БД, там JSON и нет проверок реферрера/юзер-агента, так что вроде всё просто. Но времена меняются и они чего доброго там или сайт заредизайнят или защит понавешают от такого огульного злоупотребления. Нужно какую-то платформу наверное сразу закладывать, чтобы умела прикидываться бровсером, чтобы её было легко перенастроить, чтобы она уже была с готовыми либами чтобы данные экстрактировать (желательно из pdf тоже на всякий случай), складывать всё это в базу данных, и желательно чтобы эта платформа была не на каком-нибудь маргинальном языку написана. Есть идеи?</p>]]></description>
</item>
</channel>
</rss>