e.motion
Статьи

Время новостей

Авторы: Александр Белков, Дмитрий Смирнов
Опубликовано в журнале «Домашний компьютер» №4 от 5 апреля 2006 года.

Если вы иногда заглядываете в Интернет, на его просторах вам наверняка встречалась аббревиатура RSS. Если нет — напоминаем: белые буквы RSS на фоне рыжего прямоугольника… Что-то видели? На новостных порталах? В блогах? В браузере Firefox? Читали статью, но не помните, о чем шла речь? Забудьте. Сейчас мы все расскажем сначала, ибо перед вами — самый подробный материал об RSS на русском языке за всю историю этой технологии.

Явление под названием RSS многогранно, почти как сам Интернет или TCP/IP, хотя и не столь глобально. У него есть несколько значений и областей применения. С точки зрения пользователя, RSS — это способ, которым сайты отдают ему, пользователю, информацию. С точки зрения веб-программистов, RSS — отличный механизм взаимодействия сайтов друг с другом. С его помощью сайт может автоматически отдавать информацию пользователю-читателю или другому сайту или, наоборот, автоматически забирать информацию из разных источников. Например, RSS предоставляет возможность обмена рекламной или корпоративной информацией, построения деловых сетей и других автоматизированных конструкций. Итак: RSS — во-первых, структурирование информации, а во-вторых, механизм обмена ею. А теперь подробнее.

RSS для читателей

Если вы относите себя скорее к посетителям сайтов, чем к их авторам, вероятно, в Интернете вы регулярно читаете блоги (сетевые дневники) или новостные ленты, или просматриваете фотографические порталы, или, наконец, интересуетесь профессиональными онлайновыми сообществами. Чем обширнее круг ваших интересов, тем больше сайтов вам приходится просматривать. Разнообразие их интерфейсов и различный подход к подаче и структурированию информации затрудняет ее восприятие. Вам приходится переключаться с одного интерфейса на другой и перезагружать страницы браузера, чтобы увидеть, не появилось ли там новых записей…

Это понимают создатели и владельцы интернет-ресурсов. Поэтому каждый уважающий себя контентно-ориентированный сайт предлагает свою информацию не только в виде веб-страниц. На страницах сайта, вы, скорее всего, сможете найти кнопочку с надписью «RSS» (реже — «XML»). Эта кнопка приведет вас к ссылкам на так называемые «RSS-фиды» (RSS feeds — потоки, ленты).

Если вам что-нибудь говорит словосочетание «новостные группы» (newsgroups, NNTP), то работа с RSS-фидами затруднений не вызовет, чтение NNTP и RSS — занятия схожие. Итак: RSS-фид — это некий источник данных (новостей, постингов в блоге или любой другой структурированной информации). Это место, где желающим раздают информацию. Например, «Яндекс» раздает свою корпоративную ленту новостей в виде RSS по адресу http://company.yandex.ru/news/news.rss, а также предлагает свои услуги в качестве сборщика RSS-фидов (агрегатора; но об этом чуть позже). Дневник любого пользователя блог-системы «Живой журнал» можно найти в RSS-формате по адресу http://имя_пользователя.livejournal.com/data/rss. Обычно RSS-фид содержит 20 последних записей, но, разумеется, веб-мастера могут менять этот параметр.

Для пользователя главное преимущество RSS заключается в возможности создать новостную (или, точнее, информационную в широком смысле) ленту по интересующей его тематике без необходимости ежеутреннего просмотра десятков электронных изданий. При правильной организации этой ленты программа для чтения RSS сама заберет от каждого сайта нужную информацию и покажет вам ее в текстовом или HTML-виде. Таким образом, читателю не придется раз от разу «наслаждаться» творчеством, допустим, флэш-аниматоров и гадать, где на этот раз хитроумные художники спрятали кнопочку «Закрыть».

Каждый сайт может предлагать несколько RSS-фидов. Это могут быть как разные по содержанию ленты (например, новостной портал может предоставлять отдельно новости культуры и отдельно — животноводства), так и по-разному оформленные потоки одних и тех же данных. Обычной практикой в RSS является лишь анонсирование информации, полную версию которой предлагается прочитать на сайте. К примеру, новостной портал может предложить несколько фидов, один из которых будет содержать только заголовки новостей и ссылки на них, другой, кроме этого, предложит и краткое содержание новости, а третий — заголовки, полный текст новости и даже небольшую иллюстрацию. Разумеется, не стоит размещать в RSS-канале в качестве контента огромные аналитические материалы: их все же удобнее читать на сайте, где они представлены в красиво сверстанном виде. К тому же RSS предполагает просмотр достаточно быстро обновляемого потока информации, так что пока пользователь найдет время прочитать объемный материал, тот может уже кануть в Лету (в смысле — смениться новыми данными). А в RSS-ридере пользователь, увидев заинтересовавшую его тему, может поставить на нее закладку и отложить прочтение до лучших времен.

В качестве примера разного оформления одной и той же информации можно привести RSS-потоки сайта http://dirty.ru: по адресу http://dirty.ru/rss_simple.xml находится лишь текст постингов этого, как принято говорить, «коллективного блога»; по адресу http://dirty.ru/rss.xml — те же постинги, но с указанием количества комментариев к ним, а по адресу http://dirty.ru/rss_complex.xml, цитируем, «количество комментариев, автор поста и ссылка на его профиль, закодированные спецтэгами главного управления КГБ. Хорош для Искусственного Интеллекта и его слуг».

Или другой пример: на фотосайте «Иероглиф» лента публикуемых фотографий выдается в нескольких RSS-представлениях. По умолчанию предлагается фид http://hiero.ru/?&rss=html2, содержащий превью выставленной фотоработы размером 150×150 пикселей и красивый HTML в ее описании. Или варианты http://hiero.ru/?&rss=full — полная информация о работе, или http://hiero.ru/?&rss=html — автор, превью и дата публикации, или http://hiero.ru/?&rss=1 — простейшее представление без превью. Кроме этого, на сайте есть RSS-ленты списка комментариев ко всем работам.

Что такое Atom

Кроме RSS, существует еще один известный стандарт для агрегирования информации — Atom. Стандарт RSS 2.0 оказался, фактически, замороженным после того, как Дэйв Вайнер передал его Гарвардскому университету. В него вносят лишь мелкие, косметические изменения; при этом его функциональность и внутреннее устройство многих не устраивают. Программисты поняли, что новый стандарт нужно разрабатывать уже под новым именем, «брэндом». Atom — пример как раз такой разработки.

Не будем подробно описывать технические различия Atom 1.0 и RSS 2.0. Скажем лишь, что они принадлежат разным пространствам имен; Atom четко декларирует, с каким типом данных — HTML или текстом — он работает, тогда как RSS 2.0 этого не делает; Atom может быть разбит на несколько файлов-записей, а RSS представлен только в виде целого файла-канала, и так далее. К тому же, Atom — открытый и эволюционирующий стандарт.

Поэтому при выборе программы-агрегатора лучше выбрать такую, которая поддерживает оба стандарта; впрочем, таких «читалок» сейчас большинство. Многие веб-ресурсы предлагают свои потоки данных одновременно как в RSS, так и в Atom. Это и тот же Livejournal.com или Google News — новостная лента, в реальном времени сканирующая 4500 источников (в основном, англоязычных). Подробнее о стандарте Atom (на английском языке) можно прочитать в «Википедии» по адресу http://en.wikipedia.org/wiki/Atom_ (standard).

В лес по RSS

Разобравшись с тем, что можно получить в виде RSS, давайте посмотрим, как это сделать. Разумеется, с помощью специальных программ для чтения новостей. По-английски они называются aggregators, и это слово — «агрегатор» — постепенно закрепляется в русском. В словарях оно встречается именно в таком виде — с одной буквой «г». Если встретите такой термин, знайте: за ним скрывается, в общем случае, программа для сбора и чтения новостей.

В интернет-энциклопедии Wikipedia можно найти обширный список сервисов и программ для чтения новостей — более или менее платных или бесплатных. Они разделяются на онлайновые агрегаторы (сайты, предлагающие сбор и отображение информации из RSS-источников); программы-агрегаторы для Windows, Linux, Apple и примкнувшие к ним кроссплатформенные решения; агрегаторы для мобильных устройств; решения для веб-серверов и программы, позволяющие читать RSS-потоки из командной строки. Также там перечислены сервисы, пересылающие содержание RSS-лент на электронную почту или SMS, а также RSS-механизмы, встроенные в операционные системы или почтовые клиенты и веб-браузеры.

Существует около десятка подключаемых модулей для браузера Mozilla Firefox, которые позволяют получать с его помощью RSS-потоки в том или ином виде, не говоря уже о том, что в Firefox есть и собственная поддержка RSS. Реализована она довольно остроумно: можно занести источник RSS в закладки, где он будет отображаться в виде папки. При ее открытии RSS-фид будет отображен в ней в виде N ссылок (обычно N=20) на анонсируемый контент. Очень удобно.

Разумеется, подобные «панели инструментов» написаны и для Internet Explorer. Написаны и расширения для Microsoft Outlook, превращающие эту программу в агрегатор.

Бесплатный почтовый клиент Mozilla Thunderbird был оснащен средствами для чтения RSS-новостей «от рождения», дополнительные модули для этого ему не требуются. Для The Bat! также можно мгновенно найти подключаемый модуль, который сделает из него RSS-читалку. Для этого достаточно набрать в поисковике «The Bat+RSS».

Описать всю сотню агрегаторов, перечисленных в «Википедии», по причинам техническим и здравого смысла мы не можем. К тому же, там описаны далеко не все известные науке программы для чтения новостей. Но стоит обратить внимание на бесплатную программу Abilon News Aggregator (или ее коммерческий вариант ActiveRefresh). Нам встретился ее билд 2.5.3. Весит Abilon меньше 700 Кбайт, может иметь русский интерфейс, обновляет информацию о каналах по расписанию, позволяет делать заметки и сохранять нужные постинги в офлайне, поддерживает RSS 0.91, RSS 1.0, RSS 2.0 (то есть фактически все три основных стандарта RSS), Atom 0.3, OPML. Оборудована (и ActiveRefresh) встроенным браузером, поддерживает блоги (например, ЖЖ), позволяет размещать столбцы и колонки по вкусу, знает, что такое HTTP-прокси, HTTPS и SSL, умеет архивировать входящие данные и даже вырезает из получаемого HTML потенциально опасный код. К сожалению, основной сайт программы на момент написания статьи не отзывался. Впрочем, в Сети лежит миллион копий программы, и найти дистрибутив с помощью любой поисковой системы не составит труда. Можно воспользоваться и онлайновой «машиной времени».

Если не найдете Abilon или он вам не понравится, как вариант можно рассмотреть агрегатор Omea Reader 2.1.4. В бесплатной версии дистрибутив весит 4,8 Мбайт, платный вариант Omea Reader Pro — чуть больше шести. Этот гигант является поистине информационным новостным центром, этаким персональным агентством. Посудите сами: он заменяет собой органайзер электронной почты, средства локального поиска, систему управления персональной информацией, средство для чтения новостей практически в любом формате, может работать планировщиком и адресной книжкой, держать коллекцию закладок и даже централизованно запоминать историю вашей переписки в разных программах-мессенджерах. Кроме этого Omea может открывать файлы Word, Excel, PDF и показывать картинки. Все эти данные софтина умеет индексировать, что в сочетании с отличной поисковой системой переводит эту программу в первые ряды кандидатов на установку.

Для тех, кто предпочитает не связываться с клиентскими программами и быть максимально мобильным, идеально может подойти вариант использования онлайн-агрегатора. В его роли может выступить, к примеру, сервис «Яндекс.Лента».

Для создания своего персонального веб-агрегатора на «Яндексе» нужно зарегистрироваться и после получения «Яндекс.Паспорта» приступать к созданию своей ленты. Сначала на странице «Управление RSS-потоками» вам предложат завести имя одной или нескольких лент. После этого на закладке «Добавить RSS-поток» вам нужно добавить в ленту RSS-потоки. Годится и прямой адрес RSS-потока (примеры про Dirty.ru или Hiero.ru мы приводили выше; таких потоков в мире многие миллионы), и имя интересного вам журнала на Livejournal.com (таким образом можно будет составить на «Яндексе» ЖЖ-френдленту, правда, состоящую только из открытых для всех записей), а можно подписаться на поисковые запросы «Яндекса» — по новостям или по блогам. Таким образом, используя собственные поисковые возможности, «Яндекс», найдя интересующее вас ключевое слово в ленте новостей или в блогах (а блогами этот сервис считает практически любой известный ему RSS-источник), выдаст вам список результатов в виде RSS-ленты. На закладке «Внешний вид» вы выбираете, сколько результатов вы хотите видеть на одной странице, и в каком виде — полные сообщения или только заголовки. Если вы читаете ЖЖ, например, трехсот человек, то «забивать» их имена в «Яндекс.Ленту» по одному — занятие довольно утомительное. На этот случай в «Яндексе» есть средство для автоматического импорта списка друзей из ЖЖ: на соответствующей странице указываете ваше имя в ЖЖ и нажимаете кнопку «Импортировать». Там же есть вариант импорта списков RSS-источников из других программ или сайтов в формате OPML (стандарт, который, в основном, используют для импорта, экспорта или хранения списков RSS-каналов). Работать с OPML мы не пробовали, но вот с импортом друзей у «Яндекса» явно не все гладко. При попытке забрать список друзей из ЖЖ он многозначительно сказал: «Нет новых RSS-потоков для добавления». Мы надеемся, что «Яндекс.Программисты» когда-нибудь доведут эту функцию до ума, ведь идея использовать агрегатор, базирующийся на поисковой машине, довольно привлекательна.
Естественно, свой сервис для чтения RSS предлагает и вездесущий Google. Он называется Google Reader, традиционно функционален и удобен и доступен всем обладателям Google-аккаунтов. К слову, Google сейчас переводит на RSS-рельсы свою систему контекстной текстовой рекламы — AdSence for feeds. А это что-нибудь да значит, ведь известно: чего хочет Google, того скоро захотят все.

Голосуй за RSS!

Что влечет за собой использование RSS? Как минимум, спасение пользователей от спама, который в масштабах Интернета можно назвать проблемой уровня «международного терроризма». Так, в последнее время спамеры часто используют Subscribe.ru в качестве имени отправителя письма, и подписчик поневоле заглядывает в его текст. С приходом RSS стало возможно поставить автоматический фильтр на немедленное уничтожение писем, содержащих слова Subscribe.ru, а рассылки этого сайта читать в RSS-ридере. Это, во-первых, действительно спасает от спама, а во-вторых, позволяет сразу сортировать обновления Subscribe.ru по тематическим лентам и читать их, когда захочется, а не когда письму вздумается упасть в ящик.

Опять же, пользователь начинает уставать от аудиовизуального бума в Сети: безумные анимированные интерфейсы, красивая, но навязчивая флэш-реклама… Люди начинают все больше ценить лаконичную подачу информации, им все чаще нужно «ехать», чем «шашечки».

RSS только становится популярным, но благодаря бесчисленным вариантам применения этой технологии, за нее можно не беспокоиться. К примеру, компании Santa Cruz Tech и PubSub недавно анонсировали сервис http://feedbeep.com. За разумные деньги он предлагает сканировать отобранные пользователем ресурсы и отсылать информацию об их обновлениях на сотовый телефон. А вспомните про подкастинг, о котором ДК рассказывал в январе этого года, — в его основе лежит именно RSS в сочетании с MP3.

Пользователи, привыкшие читать ту же ленту ЖЖ в RSS-клиенте, уже не хотят возвращаться к браузеру; они не откажутся от экономии времени и привычки видеть информацию в строго определенном виде.

В результате все это ведет к изменению Интернета в целом. Грядет Веб 2.0, Internet2, называйте как угодно. Из набора сайтов он будет постепенно превращаться в набор информации, плавно перетекающей с одного носителя на другой, от сайта к сайту, автоматически, с помощью той же технологии RSS и ее наследников. Границы между хранилищами информации, которыми сейчас являются сайты, будут стираться, а Интернет превратится в один большой сервер. Информация будет нести в себе информацию о том, у кого к ней есть доступ, а у кого нет; метаданные — основа грядущей Матрицы.

И немалую роль в этом процессе сыграет значок, на котором раньше были три буквы, а теперь — три полоски: значок RSS. Просто RSS.

При подготовке статьи использованы материалы из «Википедии», сайта Diveintomark.org. Авторы также благодарят Давида Мзареуляна и проект Dirty.ru.

Домашний компьютер #1_1996

Сетевые телеконференции — одна из услуг Internet, предоставляющая возможность переписки сразу со множеством людей, интересующихся одной и той же темой. Телеконференции являются наиболее удобным, экономичным и широко распространенным средством общения. Они могут иметь вид «групп новостей» (newsgroups) или серверов рассылки (типа listserv). Многие сети поддерживают собственные телеконференции, устроенные по принципу внутрисетевой электронной доски объявлений. Обсуждения в сети типа listserv или majordomo проводятся в виде подписки, когда пользователь «заказывает» себе избранную конференцию и получает всю поступающую в нее корреспонденцию. Он может также направлять свои сообщения остальным подписчикам. Другой тип конференций, «группы новостей», устроен иначе. В них нет необходимости получать сразу всю переписку участников — можно просмотреть список поступлений и заказать заинтересовавшую вас статью.

Сергей Минин, «Технология Сети»
  • WordPress

Speak Your Mind

Tell us what you're thinking...
and oh, if you want a pic to show with your comment, go get a gravatar!

e.motion