Что делать, если у сайта нет RSS-канала

Что делать, если вам сильно хочется следить за обновлениями информации на чьем-то сайте, но при этом у этого сайта нет своего RSS-канала?

Оказывается, все-таки есть выход из этой ситуации.

Логотип сайта page2rssСамый просто способ – это использовать сайт page2rss.ru. Этот сайт будет следить за страницей в интернете, которую вы укажете, и как только будет видеть какие-то изменившиеся данные, будет публиковать их в виде RSS-канала, на который вы и можете подписаться (после указания адреса страницы и нажатия кнопки «to RSS» справа появятся кнопки для подписки на RSS).

Нюанс только в том, что вы не будете в итоге видеть какие-то аккуратно оформленные новости, а будете видеть именно измененные куски. Хотя, наверняка, в некоторых случаях не такие они и страшные могут быть 🙂 Но даже если в RSS-канале информация будет представлена несколько хаотично, основную задачу этот сервис выполняет. Вы всегда будете знать, что на странице произошло обновление, примерно понимая, какой оно имеет характер. Вообще, применений можно найти массу – можно следить за изменениями в какой-либо статье, новыми комментариями к чему либо, за изменениями в каких-либо рейтингах и т.д., и все это невзирая на отсутствия соответствующих RSS-каналов на нужных вам сайтах.

Есть, правда, как мне кажется, одно НО. Если на странице, за которой вы следите, присутствует какой-то элемент, который при каждом обновлении оной изменяется, то в итоге ничего путного из такой RSS-ленты не получится. Пример такого безобразия можно увидеть на моем проекте www.ezoterik.info, где в правом верхнем углу каждый раз выводится новая цитата. Как я понял, проверка обновления на сайте происходит у этого сервиса каждые 4 часа. В таком случае он каждые 4 часа будет вам выдавать информацию об очередной цитате вперемешку с заголовками новых тем на форуме (ведь на этой же странице имеется список последних тем с форума, который тоже может обновляться достаточно часто). С какой бы частотой не происходила проверка страницы, на ней всегда будет что-то «новое».

Более подробный обзор этого сервиса можно увидеть здесь, где имеются и интересные комментарии с примерами применения этого сервиса, а так же ссылки на другие подобные сайты.

Более сложный способ – это использовать более «продвинутые» сервисы, дающие вам больший контроль над ситуацией.

Логотип сайта feed43Один из таких сервисов — feed43.com. Сайт на английском языке, что, в общем-то, не мешает нам его использовать. Идея в том, чтобы вы указали, из каких именно блоков на странице нужно брать информацию для RSS-ленты. При таком подходе вы избегаете «мусора в эфире». Здесь вы найдете достаточно подробную инструкцию по использованию этого сервиса (на русском). Лично у меня только не получилось задать имя и описание RSS-канала на русском языке, пришлось писать транслитом. Подопытной у меня была та самая первая страница на www.ezoterik.info, в результате чего получился очень даже симпатичный RSS-канал. Этим сервисом я остался очень доволен.

Если у вас не получится сделать шаблон (второй шаг действий из инструкции), к какой-либо интернет-странице, я могу помочь составить его в комментариях к этой статье.

Логотип сайта rssproxyЕще есть сайт rssproxy.ru, он на русском языке и к нему прилагается подробная инструкция. В целом принцип работы с ним такой же, как у предыдущего сайта, но лично мне этот сервис показался достаточно «сырым», к сожалению.

Во-первых, оказалось, что я не могу вернуться и отредактировать шаблон для RSS-канала (поэтому канал остался не совсем корректным), попытка вернуться и сделать все сначала приводит к появлению надписи:

такой сайт уже есть в базе данных, вот ссылка на RSS канал: http://rssproxy.ru/rss/www.ezoterik.info/index.rdf

Таким образом, получается, что если до вас кто-то уже добавил страницу сайта, которая вас интересует, то сделать свой канал (с другими настройками шаблона) вы не сможете, будете вынуждены пользоваться тем, что дают. Возможно, что я чего-то и не доглядел, но, похоже, что картина именно такая.

Во-вторых, в вашей готовой ленте внутренние ссылки в новостях не обязательно будут вести именно на сайт, откуда берется новость (в моем случае они ведут на сайт rssproxy). С сервисом от feed43 такой проблемы нет.

И в третьих, формы для работы с созданием RSS-канала коряво отображаются во всех браузерах (пробовал на том, что было: Firefox и Opera), кроме Internet Explorer`а.

Надеюсь, эта информация будет для кого-то полезной, и желаю всем активного и плодотворного использования RSS 🙂

 

Также хотел бы дополнить свои предыдущие статьи на тему RSS («Что такое RSS» и «RSS-агрегаторы или чем читать RSS«).

Нашел в интернете еще дополнительный материал об RSS:

  • Статья от Жилинcкого Владимира — «Что такое RSS». Так же в ней есть много интересных ссылок, касающихся тематики RSS.
  • Все о RSS – сайт, обещающий за 5 минут научить вас пользоваться интернет-технологией, которая изменит вашу жизнь. Сайт выполнен в виде некой презентации, в легкой и пошаговой форме объясняющий, что такое RSS и чем читать RSS-каналы. Особый упор сделан на иллюстрацию этого процесса в Google Reader (намного подробнее, чем было у меня в предыдущей статье).

Логотип Google ReaderТак же, я перешел наконец-то на использование Google Reader, чему безмерно рад 🙂 Удобство работы с RSS-каналами на порядок выше по сравнению с Яндекс.Лентой, хотя, вполне возможно, что Яндекс тоже не будет стоять на месте, кто знает…

В Google Reader, помимо всего прочего, обнаружил дополнительную «фишку». Когда вы уже подписаны на какие-то RSS-каналы, Google предлагает вам список каналов, на которые вы еще не подписаны и которые могут вас заинтересовать. Предположения о том, что вас заинтересуют те или иные RSS-каналы, строятся на основе сравнивания ваших интересов с каналами других пользователей Google Reader, имеющих схожие интересы (подробнее в их справке). Я таким образом нашел для себя еще массу интересных каналов/блогов.

Автор

  • Mike

    Спасибо за статью!
    Долго и упорно пытался сделать шаблон в feed43.com для сайта http://www.nnm.ru — нифига не получается 😉
    Был бы благодарен за помощь!

  • Да, самому одно время было не удобно, что там нет RSS 🙂 Потом как-то так случилось, что просто перестал там бывать.

    Вот ссылка на готовый канал: http://feed43.com/7082603150445384.xml

    Он транслирует новости с первой страницы. Кажется, все получилось вполне нормально.

    Вот настройки feed43 которые я использовал (так Вы сможете понять, что делали не так):

    Address*:
    http://www.nnm.ru/index.php

    Encoding:
    windows-1251

    Global Search Pattern:
    <body>{%}</body>

    Item (repeatable) Search Pattern*:
    <h2 class="new-title"><a{*}href="{%}">{%}</a></h2>{*}<div class="new-text">{%}</div>

    Item Title Template*:
    {%2}
    Item Link Template*:
    {%1}
    Item Content Template*:
    {%3}

  • Наталья

    Очень-очень в тему мне и моим посетителям интернет-центра. Попробую таким образом решить вопрос с Прозой.ру, администрация которой пообещала мне «со временем» кнопку рсс, а мне уже сейчас надоело там шариться в поисках обновлений у 3-5 интересующих меня людей.
    Гугльридер — да, осваиваю, сравнивать не с чем, но удобно. Пока путаюсь там, как переводить в общее и личное, не помечая каждую запись, но со временем разберусь, если что, спрошу.
    Вообще думала, что раз блог программистский, то мне не сюда, но увидела «ликбез» — и обрадовалась: туда попала ))

  • DrSterling

    Огромное спасибо за информацию о сайте Feed43 !!!
    А то с Page2RSS уже намучился 👿 По тем причинам что вы указали: нельзя иам явно сказать ЧТО ты хочешь.

    Кстати, Feed43 уже на русском, для меня не принципиально, но все равно приятно.
    Еще раз спасибо

  • Константин

    помогите пожалуйста, облазил множество статей,но видно мозгов не хватает. Мне нужно следить за рядом сайтов, (к примеру http://www.cmcdv.ru) и у многих из них нет RSS, на них публикуется множество информации, в хаотичном порядке или просто документы без сылок,которые найти можно посредствам точного запроса в поисковике. Хотел бы найти программу которая запоминала сайт целиком,и когда в нем публикуют новые материалы я мог это заметить. пробовал пользоваться WebSite-Watcher(программа выдает тысячи ссылок, по которым нереально орентироваться), Sitespector удобно, но проверяет только главнуюстраницу сайта(указанную ссылку), Google Reader (вообще не пойму чтоон хочет отменя, недобовляет мойсайт). подскажите пожалуйста чем лучше пользоваться.

  • Pingback: WebMon — бесплатная программа для слежения за обновлениями сайтов()

  • jacoblop

    респект за пост, только не совсем понял последний абзац….

  • Спасибо за пост! но все чаще и чаще на сайтах есть rss

  • page2rss.ru уже не открывается.

  • Sdfsdf
  • Сергей Румянцев

    Помогите, пожалуйста, со страницей http://kaliningrad-gortrans.ru/news.html. Какая-то нестандартная там разметка, а feed43 выдаёт ошибку… вот был бы там режим отладки!…

    • Слава Финист

      А чем лучше подцепить РСС c сайта «Собственный рай» http://w5x.ru

  • Денис

    ezoterik, добрый день! Не могу с Вами связаться. Помогите пожалуйста правильно оформить RSS канал для гаджета на рабочий стол. Новости, которые поступают на сайт очень важны для меня и такой информации нигде больше нет, но у них нет RSS из личного кабинета, а постоянно держать открытым еще один браузер для просмотра этих новостей не совсем удобно!!! Более того информация, которую предоставляет сайт из первоисточника стоит N сумму, а так, как я являюсь их клиентом, новости бесплатны. Пробовал создать RSS канал сам несколько раз через feed43.com, но к сожалению не получается. Очень прошу Вас о помощи!!!