anonymous@RULINUX.NET~# | Last login: 2024-11-09 00:42:33 |
Регистрация Вход | Новости | Разметка | Пользователи | Галерея | Форум | Статьи | Неподтвержденное | Трекер | Правила форума | F.A.Q. | Ссылки | Поиск |
Форум - Talks | [RSS] |
Есть некоторая идея - сделать агрегатор. Парсер инфы сделать как можно не зависимым от кода. В этом случае парсер легко можно будет адаптировать к переделке дизайна сайта.У кого есть опыт таких штук, готов обменяться знаниями.
Ну вообщем вопрос, если кто сталкивался. Давайте обсудим тему. Если кто не сталкивался давайте обсудим, что же все таки творилось на фотографии в этом посте Все принцессы делают это
Ax-Xa-Xa(*) (2012-01-25 01:12:58)
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.75 Safari/535.7
|
|
|
Скрыть
Re:Ладно, давайте рассмотрим чего-нибудь интересное ...Алсо, в наше время можно даже не адаптировать почти ничего: http://www.readability.com/ |
Скрыть
Re:Ладно, давайте рассмотрим чего-нибудь интересное ...>> В этом случае парсер легко можно будет адаптировать к переделке дизайна сайта.
Ax-Xa-Xa(*)(2012-01-25 01:31:05)
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.75 Safari/535.7 |
Скрыть
Re:Ладно, давайте рассмотрим чего-нибудь интересное ...>Да это будет основная работа в этом предприятии, поддерживать адекватность парсеров.
|
Скрыть
Re:Ладно, давайте рассмотрим чего-нибудь интересное ...> Алсо, в наше время можно даже не адаптировать почти ничего: http://www.readability.com/
Ax-Xa-Xa(*)(2012-01-25 01:39:13)
Отредактировано Ax-Xa-Xa по причине "не указана" Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.75 Safari/535.7 |
Скрыть
Re:Ладно, давайте рассмотрим чего-нибудь интересное ...Да, насчёт readability. Это штука, которая довольно неплохо умеет выдирать из веб-страницы "основной" контент, по куче эмпирических алгоритмов. Есть реализация для питона, кстати. На форумах относительно часто ошибается, а вот на стандартной странице вполне эффективно выдирает действительно нужную информацию. |
Скрыть
Re:Ладно, давайте рассмотрим чего-нибудь интересное ...> Да, насчёт readability.
Ax-Xa-Xa(*)(2012-01-25 01:53:20)
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.75 Safari/535.7 |
Скрыть
Re:Ладно, давайте рассмотрим чего-нибудь интересное ...>Понимаешь, я может тупля. Но эта твоя самая "readability" очень сильно зависит от природы информации, которую мы собираем.
|
|
|
|
Этот тред читают 4 пользователя: |
Анонимных: 4 Зарегистрированных: 0 |
Re:Ладно, давайте рассмотрим чего-нибудь интересное ...
>В этом случае парсер легко можно будет адаптировать к переделке дизайна сайта.
Так вся работа написания парсера, обычно, в этом и заключается.
Emacs-w3m/1.4.414 w3m/0.5.3