RSS агрегаторы - что это такое

igor_nko

New member
Joined
Oct 3, 2005
Messages
2
Reaction score
0
Age
56
Location
Kiev
Сейчас мы имеем парадоксальную ситуацию — информации много, безумно много, новости и статьи появляются постоянно, но из-за их количества, они зачастую запаздывают или проходят незамеченными. Более того — объем информации увеличивается просто с головокружительной скоростью, и эта скорость всё нарастает: по данным, опубликованным компанией Netcraft (http://news.netcraft.com/archives/2005/07/01/july_2005_web_server_survey.html), только за июнь этого года в интернете появилось 2.76 миллиона новых сайтов! В этих условиях поиск информации становится всё более тяжелым. Традиционный поиск действительно эффективен лишь в руках небольшой группы пользователей: иначе просто не существовало бы того же Кубка Яндекса. Кроме того, обновление поисковой базы на большинстве поисковых серверов происходит достаточно редко, минимум раз в несколько дней, а то и недель.



Задача своевременного донесения информации до заинтересованного пользователя становится одной из основных. Сейчас читатель уже не может ежедневно просматривать десятки, а то и сотни сайтов, в ожидании новой статьи или поиске интересующей его новости. То, что такая ситуация становится всё более распространенной, стало понятно давно. Различные фонды, институты и компании задумывались над способами разрешения этой проблемы. Варианты решений самые разные — от глобальной концепции Semanitc Web до появлявшихся многочисленных технологий, ставивших своей целью быстрое донесение информации об обновлениях до конечного пользователя. Так были созданы Channel Definition Format (CDF) от Microsoft, PointCast, поддерживавшийся Netscape, Marimba Castanet и многие другие. К сожалению ли, к счастью ли, но даже среди специалистов лишь единицы сейчас вспомнят хотя бы название большинства этих технологий.



Эта статья посвящена наиболее успешной технологии в данной сфере, уже превратившейся в стандарт de facto — RSS.

Суть и практическое применение стандарта
Но давайте расскажем, что же это такое RSS. Это семейство стандартов формирования XML-документа, в который сохраняется информация об обновлениях на сайте. Представители этого семейства стандартов частично несовместимы друг с другом, но для конечного пользователя это не имеет значение — любая современная программа для работы с RSS понимает все его версии.



RSS, как подмножество XML, лишен одного из главных недостатков HTML — его запутанности и перегруженности «оформительскими» элементами, которые делают автоматическое унифицированное получение информации почти невозможным: как мы уже говорили, в RSS транслируется только информация без каких либо элементов дизайна, навигации и т.д. Таким образом, пользователям КПК не придется лишний раз задумываться о «паразитном» трафике, а новость, транслируемую на корпоративном портале, можно обработать и выдать в любом необходимом виде, так, чтобы она не выбивалась бы из общего оформления.



Не знаю ли, к сожалению ли, с частью ли, но сегодняшняя ситуация, когда RSS-ленты свободны от рекламы, может скоро измениться — недавно Google официально объявила о программе по размещению контекстной рекламы AdSense в RSS-фидах. С одной стороны, это лишит RSS одного из его главных плюсов, с другой — даст возможность авторам зарабатывать и, возможно, больше времени уделять своим материалам. Google традиционно является первопроходцем, и, наверняка, скоро подобные системы появятся и у конкурентов.



RSS-файл меняется в тот же момент, когда на сайте появляется новая информация. Далее специальная программа или сервис, с заданной периодичностью проверяющая содержание этого файла, показывает пользователю, что же изменилось. Ну а потом… потом пользователь получает информацию об обновлении (анонс или полный текст новости или статьи) в том виде, как ему удобно, свободный от дизайнерских изысков авторов сайта и с минимумом служебной информации.



Полученная информация может использоваться как угодно: публиковаться на другом сайте, собираться в личные новостные ленты в Интернете с помощью специальных сервисов, таких как Мой Яндекс, NewsIsFree, Kanban и т.д., или обычном компьютере при помощи программ, называемых «агрегаторами» (Syndirella, NewsGator, OmeaReader и т.д.), или на КПК (PocketRSS, PocketFeed и т.д.) и т.д…



Наиболее яркими примерами возможностей автоматизированного сбора и публикации информации являются новостные порталы, агрегирующие новости с сотен и даже тысяч сайтов, например, http://news.yandex.ru/ и http://news.google.com/. На новостном портале Яндекса собирается информация почти с 900 сайтов, Гугла — более чем четырех с половиной тысяч…

История RSS
RSS существует уже достаточно давно. Разработка того, что впоследствии стало известно, как RSS, началась еще в 1997-ом году. Существуют несколько вариантов расшифровки этой аббревиатуры, при этом, как это ни удивительно, единой и общепринятой нет даже у разработчиков. Наиболее популярная версия — Really Simple Syndication (RSS). Также можно встретить варианты Rich Site Summary и RDF Site Summary (RDF — Resource Description Framework, стандарт схемы описания источников).



Первую известность эта технология получила, когда компания Netscape, тогда всё еще могучая, использовала её для наполнения каналов своего портала Netcenter. Вскоре эта технология уже использовалась для трансляции контента на многих новостных сайтах — в том числе таких, как BBC, CNET, CNN, Disney, Forbes, Wired, Red Herring, Slashdot, ZDNet и многих других.



Первой открытой официальной версией RSS стала версия 0.90, разработанной компанией Netscape. Однако формат, по отзывам пользователей, оказался излишне сложным и запутанным, и вскоре Netscape выпустила его упрощенный вариант — 0.91. Далее права на этот формат и его развитие перешли к компании UserLand Software, которая продолжила развитие серии версий 0.9x, объединила RSS с собственными наработками из схожей по задачам технологии ScriptingNews и выпустила версию RSS 0.92, потом 0.93, 0.94 и, в итоге, 2.0. Параллельно RSS-DEV Working Group развивала свою версию RSS и выпустила версию RSS 1.0, а затем и 1.1. Сейчас наиболее активно используются версии 0.91, 1.0 и, конечно же, 2.0.



Подобный разброд, множество одновременно используемых версий формата и постоянные склоки в стане сторонников RSS привели к появлению конкурирующей технологии — Atom. Atom построен на тех же принципах и для тех же задач, что и RSS, но исходно создавался более четко стандартизованным, и сейчас стремительно развивается. Формат уже сейчас поддерживается многими производителями новостных агрегаторов и разработчиками блогов. На сегодняшний день наиболее активным сторонником Atom является Google. Ярким примером этой приверженности стал переход Blogger.com, принадлежащей Google службы блогов, на трансляцию сообщений только в формате Atom и поддержка этого стандарта в Gmail.



Кто победит в этом противоборстве RSS и Atom — большой вопрос: на стороне RSS простота и отработанность решений, на стороне Atom — четкая стандартизация и гибкость формата.

Рост популярности у пользователей
Еще пару-тройку лет назад RSS оставался всё больше «серверной» технологией, не используемой напрямую конечными пользователями. Чтобы получить пользовательское признание любая интернет-технология должна пройти долгий путь, получить распространение, стать действительно общепризнанным стандартом, и, конечно же, должно появиться достаточное количество качественного легкодоступного клиентского ПО, работающего с ней.



Толчком для роста популярности RSS и его использования конечными пользователями, стало распространение RSS в блогах. Технология, исходно разработанная для обмена данными на больших порталах, прекрасно прижилась в мире «частной журналистики». Практически любой современный блог имеет возможность сохранять сообщения в формате RSS. Как следствие, любой пользователь имеет возможность собрать новостную ленту, которая будет интересна именно ему. Не надо ориентироваться на обзоры и ожидать обновления — один раз обнаружив автора, хорошо пишущего на интересующие вас темы, в дальнейшем вы будете узнавать о появлении новых материалов практически незамедлительно. Отметьте, что при этом вам не придется постоянно заходить на тот или иной сайт и высматривать обновления. Таким образом, в каком-то смысле RSS-ленты уравнивают возможности огромных новостных сайтов и небольших личных сайтов и блогов: если вы публикуете на своем сайте одну действительно хорошую статью раз в 3 месяца, у вас будут подписчики. Более того, благодаря RSS они узнают о появлении статьи в тот же день, когда она будет опубликована.
2003 год стал основой для активного развития RSS — появлялось всё больше сайтов, поддерживающих RSS, всё популярнее становились блоги. Блоги позволили каждому публиковать в сети свои сообщения без каких-либо технических сложностей. Стремительный рост количество блогов означал и стремительный рост числа RSS-фидов. Несовместимость различных систем блогов, таких как LiveJournal и MovableType, привела к тому, что именно RSS стал наиболее удобным и универсальным способом для сбора сообщений из различных систем в одном месте. Фактически, RSS предоставил пользователю возможность просматривать в удобных ему условиях любые RSS-ленты, на каком бы сайте и в рамках какой системы они не генерировались.



Основные успехи в распространении стандарта пришлись на 2004 год. Количество новостных «фидов» выросло многократно. Достаточно посмотреть на график на http://www.syndic8.com/stats.php, чтобы понять, насколько стремительным был этот рост. Появились программы, в которых синдикация RSS-лент, была маленьким, но очень полезным и приятным дополнением. Пользователь, и не подозревавший раньше об RSS, мог познакомиться с новыми возможностями, предоставляемыми этой технологией, не ставя каких-либо дополнительных программ — RSS-агрегаторы появились в составе Mozilla Firefox, Opera и Safari, ставшего основным браузером для MacOS.

Новости и блоги
RSS стремительно становится важным каналом для распространения новостей. Журналистика, блоги и интернет в целом создают сейчас некоторое единое пространство, границы между исходно разными жанрами стремительно размываются. Сайты журналов превращаются в блоги (наиболее ярким примером в России является журнал «Большой город» — www.bg.ru), а записи в личных дневниках служат основой для статей на первых полосах СМИ.



В 2001 году в LiveJournal очевидцы рассказывали о происходившем в Нью-Йорке, в следующие годы говорили о событиях на Норд-Осте, в Беслане, Киеве, Бишкеке… В ленты сообщений писали простые пользователи и журналисты, RSS-ленты блогов доносили свидетельства прохожих, кадры официальной хроники, фотографии, которые запрещали редакции, информация поступала постоянно, сплошным потоком, объединяя новости от официальных новостных агентств и свидетельства очевидцев.



Всё те же RSS-ленты легли в основу уже упоминавшихся новостных порталов, агрегирующих информацию со многих сотен сайтов.

На службе у корпораций
Подобная наглядная демонстрация возможностей RSS, заставили и большие компании обратить внимание на эту технологию. Наиболее важными стали действия компании Microsoft. Сначала Microsoft завела RSS-ленты у себя на сайтах, потом предложила дополнения для стандарта, а недавно было официально объявлено о включении поддержки RSS в следующую версию OS Windows — Windows Longhorn. Возможно, что еще до выхода Longhorn увидит свет Internet Explorer 7.0 со встроенной поддержкой RSS.



RSS становится стандартом де факто для автоматизированного обмена информацией. Поддержка RSS встроенными средствами Windows, самой распространенной операционной системы, только упрочит это положение. Скорость развития технологии и решений, с ней связанных, всё нарастает. Официальное признание стандарта большими корпорациями уже привело к резкому увеличению вложений в решения, связанные с RSS, и созданию специальных инвестиционных фондов.
Сейчас активно развиваются специализированные RSS-каналы. На Западе сейчас очень популярны фиды, посвященные скидкам, рекламным акциям и т.п. Технология, исходно использовавшаяся лишь техническими специалистами, нашла свое практическое применение, её стали использовать простые пользователи, журналисты, рекламисты и маркетологи. Как обычно, технология, начавшая приносить реальный доход, становится всё более популярной.

RSS в России
RSS стал распространяться в России не так и давно. Стандарт, существующий и активно использующийся на Западе в течение нескольких лет, получил действительно широкую известность в России после запуска сервиса Мой Яндекс (http://my.yandex.ru/). В рамках этого проекта кроме всего прочего появились и каталог RSS-ресурсов, и возможность получить готовый OPML-файл ресурса, т.е. список RSS-фидов, используемых сервисом, который можно сразу же импортировать в свой личный новостной агрегатор. Важным шагом стало и появление сервиса Yandex News, позволяющего в одном месте просматривать новости со всех крупнейших сайтов. Отметим также и возможности получать рассортированные по темам подборки новостей от Yandex News в рамках все тех же RSS-фидов. В этом году сервисы, посвященные RSS стали появляться с завидной частотой. Всё тот же Яндекс не так давно запустил в бета-версии сервис поиска по RSS-фидам — http://blogs.yandex.ru/. Основная цель данного сервиса — поиск по блогам и форумам. Основной плюс — очень быстрое обновление поисковой базы. Заявленная частота обновления поисковой базы — 5 минут! 1-ого июня появилась бесплатная служба Kanban (http://www.kanban.ru/), являющаяся онлайновым RSS-агрегатором. Подобный сервис планируется запустить и в рамках проектов Liveinternet.



По данным компании SpyLog, на текущий момент RSS используют всего лишь порядка 3–5% пользователей российского интернета, и перспективы роста популярности этой технологии просто огромны. Основным сдерживающим фактором сейчас является необходимость поиска, скачивания и установки специализированного ПО, так что именно появление онлайновых сервисов подобных уже упомянутым и встроенная поддержка RSS в Windows могут привести к лавинообразному росту популярности RSS в Рунете.

RSS-агрегаторы
Количество программ для работы с RSS-лентами просто огромно. Это и бесплатные программы и проприетарное ПО, онлайновые службы, плагины для различных программ и систем.

Десктоп-приложения
NewsGator — http://www.newsgator.com/ — интересный агрегатор. От подавляющего числа программ, собранных в этом обзоре, он отличается тем, что не работает самостоятельно, а служит плагином для MS Outlook. Таким образом, все новости рассматриваются Outlook’ом как обычные сообщения, а на специальной странице выводится новостная лента и информация по общему количеству сообщений и числу новостей на каждом канале.
FeedReader — http://www.feedreader.com — просто очень удобный бесплатный агрегатор.
Syndirella — http://sourceforge.net/projects/syndirella/ — интересный бесплатный агрегатор, который может не только работать с RSS-фидами, но и отображать информацию с обычных web-страниц. Исходно программа разрабатывалась Дмитрием Жемеровым, затем занявшимся проектом Omea, сейчас же программа продолжает развиваться благодаря коллективу энтузиастов.
Omea Reader — http://www.jetbrains.com/omea/reader/ — очень интересная программа, объединяющая в себе RSS-агрегатор, клиент для каналов NNTP, и менеджер закладок для веб-браузеров. Это бесплатная программа, облегченный вариант гораздо более функциональной Omea Pro.
Интернет-сервисы
KANBAN http://www.kanban.ru/ — это первая в Рунете открытая бесплатная служба для работы с новостями в формате RSS. Здесь можно создать свои новостные ленты (в терминах сайта — дайджест), сортировать их, просматривать по категориям и т.д.
NewsGator — http://www.newsgator.com/ — Про настольную версию этого агрегатора мы уже упомянули. Есть и онлайн-версия, которая стала бесплатной только в этом году. Будьте осторожны, пытаясь перенести список своих подписок из NewsGator Outlook Edition в онлайновый сервис — при этом может пострадать кириллица в названиях RSS-фидов.
КПК
PocketFeed www.furrygoat.com — небольшой RSS-агрегатор для КПК на платформе Windows Mobile. Статус — альфа, но, как ни странно, работает!
PocketRSS http://www.happyjackroad.net/index.asp — прекрасный агрегатор, поддерживающий все необходимые форматы RSS и работающий с OPML-файлами Эта программа имеет 2 компонента — отдельное приложение и плагин для Today вашего PocketPC.
Список и краткие характеристики агрегаторов для Palm можно посмотреть тут: http://palmtops.about.com/cs/productreviews/tp/Palm_RSS.htm



Существует множество других агрегаторов и выбор конкретного — скорее дело вкуса. Список наиболее популярных агрегаторов можно посмотреть, например, тут: http://www.hebig.org/blogs/archives/main/000877.php
 
Top