<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0"
					xmlns:content="http://purl.org/rss/1.0/modules/content/"
					xmlns:wfw="http://wellformedweb.org/CommentAPI/"
					xmlns:atom="http://www.w3.org/2005/Atom"
				  >
<channel>
<atom:link rel="self"  type="application/rss+xml"  href="http://rulinux.net/rss_from_sect_4_subsect_10_thread_7402"  />
<title>rulinux.net - Форум - Talks - [кпло]Тоже хочу свой поисковик.</title>
<link>http://rulinux.net/</link>
<description><![CDATA[Портал о GNU/Linux и не только]]></description>
<image><title>rulinux.net - Форум - Talks - [кпло]Тоже хочу свой поисковик.</title>
<link>http://rulinux.net/</link>
<url>http://rulinux.net/rss_icon.png</url>
</image>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53013</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53013</guid>
<pubDate>Sun, 27 Jun 2010 23:35:27 +0400</pubDate>
<description><![CDATA[<p><i>>Гугель не особо жалует автоматы</i><br> А уж яндекс вдвойне не жалует. И не разбанивает, гад, даже после сотни успешных вводов капчи.</p>]]></description>
</item>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53012</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53012</guid>
<pubDate>Sun, 27 Jun 2010 22:27:55 +0400</pubDate>
<description><![CDATA[<p><i>> поисковики использующие Гугель или Яндокс.</i><br> Гугель не особо жалует автоматы</p>]]></description>
</item>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53011</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53011</guid>
<pubDate>Sun, 27 Jun 2010 22:00:08 +0400</pubDate>
<description><![CDATA[<p>Лучше делать узкоспециальные, заточенные на определенный контент поисковики использующие Гугель или Яндокс. Или Нигму для нердов-математиков.</p>]]></description>
</item>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53010</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53010</guid>
<pubDate>Sat, 26 Jun 2010 10:42:26 +0400</pubDate>
<description><![CDATA[<p><i>>> Какие есть мысли?</i><br><i>> Когда станешь миллиардером со своим поисковиком, тебе будет некуда девать деньги. Вот я с удовольствием их приму в дар.</i><br> Что бы стать миллиардером поисковника не достаточно. "Простые" парни из google и yahoo учились в Станфорде, а это связи с нужными людьми.</p>]]></description>
</item>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53009</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53009</guid>
<pubDate>Sat, 26 Jun 2010 09:37:29 +0400</pubDate>
<description><![CDATA[<p><i>> с такими вопросами тебе сюда -  &nbsp;<a href="http://www.nigma.ru/">http://www.nigma.ru/</a></i><br> Вау, круто: "Nigma стала самым интересным стартапом имеющим на логотипе изображение паучка по версии Forbes". </p><p>Они опенсорсные?</p>]]></description>
</item>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53008</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53008</guid>
<pubDate>Sat, 26 Jun 2010 09:30:11 +0400</pubDate>
<description><![CDATA[<p><i>>Как я понимаю, программная часть не такая уж сложная.</i><br><i>> А примерный расчет серверов, железа и т. д. как прикинуть? Хотя-бы для простейшего поисковика.</i><br> Ну так как, реализуешь несложную программную часть. Потом берёшь единицу железа и тестируешь на ней сколько одновременных запросов она держит при времени отклика остающемся в пределах допустимого. Прикидываешь сколько тебе таких единиц железа потребуется, снова тестируешь уже на полномасштабной нагрузке. Если всё ОК срослось - домножаешь количество железа на 2 и просишь приготовит тебе три таких комплекта (основной рабочий, запасной и для тестирования), а сам тем временем бежишь в банк за ссудой. И вот уже из банка тебя госпитализируют.</p><p> <i>> арендовать какой-то хостинг но помощнее? Просто дома серверную разводить не хочется.</i><br> Арендуй, кто тебе мешает. Тока сначала программу напиши и прикинь железо..</p><p> </p>]]></description>
</item>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53007</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53007</guid>
<pubDate>Sat, 26 Jun 2010 05:43:07 +0400</pubDate>
<description><![CDATA[<p>с такими вопросами тебе сюда - &nbsp;<a href="http://www.nigma.ru/">http://www.nigma.ru/</a></p>]]></description>
</item>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53006</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53006</guid>
<pubDate>Sat, 26 Jun 2010 02:48:26 +0400</pubDate>
<description><![CDATA[<p>Да гугл еще тот ФБР сам по себе.</p><p>Надо срочно мир спасать и писать коммунистический Энгельс и спасать мир от империалистического за всеми шпионящего гугла. :)</p><p>В общем ладно это все лирика</p><p>Теперь к физике и серьезным вопросам.</p><p>Как я понимаю, программная часть не такая уж сложная.</p><p>Теперь к железу.</p><p>А примерный расчет серверов, железа и т. д. как прикинуть? Хотя-бы для простейшего поисковика.</p><p>Или для начала чтобы самому не заморачиваться с серверами и с высокоскоростными подключениями  для этого дела можно арендовать какой-то хостинг но помощнее? Просто дома серверную разводить не хочется. Да и бабла в сервера надо втюхать, а пойдет или нет неизвестно. Или все-таки лучше свои сервера?</p><p>В общем вопросов масса по организации.</p>]]></description>
</item>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53005</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53005</guid>
<pubDate>Sat, 26 Jun 2010 01:46:16 +0400</pubDate>
<description><![CDATA[<p><i>> Нифига себе, я думал наоборот это самая сложная часть процесса.</i><br> wget -r ИМЯ_ЛЮБОГО_САЙТА</p><p>Потом парсишь улов, вытаскиваешь из них ссылки на новые, ранее непосещённые сайты и снова тащишь рекурсивно. </p><p>Другой вопрос чо с вытащенным делать и как потом обеспечить выдачу релевантных результатов поиска за очень короткое время.</p><p> <i>> Я понимаю, а почта и другие сервисы делаются для того, чтобы привлекать посетителей.</i><br> Да нет, что ты. Хороших поисковиков намного меньше в сети, чем почтовых сервисов. Поэтому почтовые сервисы не играют роли в качестве привлекаловки новых посетителей. Единственный смысл в такой интеграции, который приходит мне на ум - это более качественное отслеживание личной жизни пользователей. Ведь если по поисковым запросам пользователя можно примерно составить представление о круге его интересов, чем он занимается в данный момент, какого уровня у него доход и примерно прикинуть его место жительства, то, например для суда над пользователем такой информации может оказаться недостаточно (хотя были и такие прецеденты - какого-то американского молчела осудили например за взлом беспроводной сети предприятия после того, как он проживая в том же районе где расположено пострадавшее предприятие поинтересовался в гугле тем, как нынче ломают беспроводные сети). Разумеется интегрированные сервисы дают лучшую доказательную базу чем просто поисковики. Если ты рассказываешь гугл-финансу про свои сомнительные финансовые операции, в гугл-почте у тебя лежит куча возмущённых писем от обманутых тобой контрагентов, в логах гугл-сёрча видно, что ты постоянно интересуешься каналами сбыта кокаина, а на гугл-картинках ты выкладываешь фотографии изнасилованных тобою жертв с датой и координатами места в exif тегах и что самое ужасное, на гугл-конфах было зафиксировано употребление тобою слов "обама", "бомба" и "нигер" в одном предложении - то тут уже любой суд присяжных согласится, что тебя лучше изолировать от общества. </p>]]></description>
</item>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53004</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53004</guid>
<pubDate>Sat, 26 Jun 2010 00:57:48 +0400</pubDate>
<description><![CDATA[<p><i>>А сложно ли вообще создать и раскрутить свой интернет-поисковик?</i><br> Создать несложно. Создать хороший - сложно. Раскрутить тоже.</p><p><i>>Может что заморачивался по таким вопросам?</i><br> Ты назвал Брина "что"?:)</p><p><i>>Какой вообще принцип работы поисковика?</i><br> Вкратце - злобный бот обходит все возможные сайты и берёт с них информацию. Далее создаются поисковые индексы, где можно для каждого ключевого слова найти список ссылок, отсортированный по куче разных алгоритмов. В них и вся суть, так как тупо по количеству данного слова/фразы в тексте искать неспортивно - результат будет уныл. Ну и веб-морда ко всему этому.</p><p>Почитай про полнотекстовый поиск для начала, есть поисковые движки (lucene, xapian, sphinx итд), где есть попытка придумать адекватные алгоритмы для вычисления наиболее лучшего результата поиска по запросу итд. Естественно у гугла всё намного хитрее, там учитывается не только само содержимое, но и ссылки на страницу, и ешё куча всего, про что они не рассказывают (и правильно делают).</p><p><i>>Северов наверно масса нужна для этого, тем более если еще и почта, сервисы и прочее.</i><br> Да. Во-первых, там большое количество информации собирается, его надо хранить. Далее информацию надо обрабатывать, что тоже затратно. И, наконец, надо обслуживать богомерзких пользователей, которые устраивают сайту невольный ДДоС.</p><p>А почта и прочее как раз делается попроще поисковика.</p><p><i>>Какие есть мысли?</i><br> Когда станешь миллиардером со своим поисковиком, тебе будет некуда девать деньги. Вот я с удовольствием их приму в дар.</p>]]></description>
</item>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53003</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53003</guid>
<pubDate>Sat, 26 Jun 2010 00:55:28 +0400</pubDate>
<description><![CDATA[<p><i>>По крайней мере можно однозначно утверждать, что поисковики существуют</i><br> Плюсую, железная логика. :)</p><p><i>>Собрать байты из сети - это самая простая и тупая часть процесса</i><br> Нифига себе, я думал наоборот это самая сложная часть процесса.</p><p><i>>Поисковик может работать и без почты, и для почты интернет-поисковик не нужен, достаточно локального поиска</i><br> Я понимаю, а почта и другие сервисы делаются для того, чтобы привлекать посетителей.</p><p></p>]]></description>
</item>
<item>
<title>Re: [кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53002</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53002</guid>
<pubDate>Fri, 25 Jun 2010 23:34:06 +0400</pubDate>
<description><![CDATA[<p>Проще всего взять исходники гугла и подправить в них главную страницу, что бы там было написано "BolgenSearch".</p><p><i>> Теперь серьезно и без лулзов:</i><br><i>> А сложно ли вообще создать и раскрутить свой интернет-поисковик?</i><br> Ты какую-нибудь хотя бы самую коротенькую заметку читал про то, как создавался гугл? На эту тему много написано, даже фильм как минимум один снят.</p><p><i>> Может что заморачивался по таким вопросам?</i><br> С.Брин со товарищи однозначно заморачивался</p><p><i>> Я думаю, что это очень сложно, но в то же время не невозможно.</i><br> По крайней мере можно однозначно утверждать, что поисковики существуют</p><p><i>> Какой вообще принцип работы поисковика?</i><br> Индексация данных </p><p><i>> Как я понимаю мониторит интернет, собирает на своих серверах данные о ресурсах и выдает пользователю при поисках.</i><br> Собрать байты из сети - это самая простая и тупая часть процесса</p><p><i>> Северов наверно масса нужна для этого, </i><br> Да.</p><p><i>> тем более если еще и почта, сервисы и прочее.</i><br> Поисковик может работать и без почты, и для почты интернет-поисковик не нужен, достаточно локального поиска</p><p><i>> Какие есть мысли?</i><br> Надо заниматься в чём разбираешься или чевонить почитать о том предмете, которым тебе хотелось бы заниматься. </p>]]></description>
</item>
<item>
<title>[кпло]Тоже хочу свой поисковик.</title>
<link>https://rulinux.net/message.php?newsid=7402&amp;page=1#53001</link>
<guid>https://rulinux.net/message.php?newsid=7402&amp;page=1#53001</guid>
<pubDate>Fri, 25 Jun 2010 23:12:00 +0400</pubDate>
<description><![CDATA[<p>Бредовая конечно идея, но вот КПЛО со своим поисковиком Энгельсом доставили лулзов. Но в любых лулзах есть доля правды.</p><p>Теперь серьезно и без лулзов:</p><p>А сложно ли вообще создать и раскрутить свой интернет-поисковик?</p><p>Может что заморачивался по таким вопросам?</p><p>Я думаю, что это очень сложно, но в то же время не невозможно.</p><p>Какой вообще принцип работы поисковика?</p><p>Как я понимаю мониторит интернет, собирает на своих серверах данные о ресурсах и выдает пользователю при поисках.</p><p>Северов наверно масса нужна для этого, тем более если еще и почта, сервисы и прочее.</p><p>Какие есть мысли?</p>]]></description>
</item>
</channel>
</rss>