Подписка RSS на Google News по определенной теме

Раз уж у меня появилась рубрика полезных советов, готов поделиться с вами одной хитростью, которая может быть полезна в повседневной работе. Речь пойдет о подписке RSS на Google News по определенной теме (ключевым словам).

Смысл этой операции состоит в следующем. Google News — мощный инструмент для поиска новостей, который включает обработку всех ведущих новостных сайтов, тематических порталов и блогов, а также СМИ в регионах. Как устроена система следует рассказать отдельно либо вы можете самостоятельно найти в интернете как включить сайт в Google News, поэтому этот момент мы пропустим.

Для того, чтобы понять алгоритм подписки RSS на новости Google разделим все наши процедуры на два больших блока: первый — описание функционирования сервиса; второй — собственно подписка на RSS Google News.

Описание сервиса Google News

Итак, начнем с того, что нам нужно посмотреть как выглядит поиск Google по новостям. Для этого используем два способа:

  1. Переход на прямую страницу новостей news.google.com и поиск по ключевому слову с этой страницы.
  2. Поиск по ключевому слову и переключению на вкладку «Новости» в основном поиске.

Если в этих двух пунктах будет что-то непонятно, уточните в комментариях. Приведу пример: ищем словосочетание арктический шельф. В обоих указанных выше алгоритмах страница результатов поиска арктического шельфа в новостях будет выглядеть так (у вас иначе, потому что новости обновляются постоянно):

Поиск Google новостей

Теперь посмотрим на URL (адрес), по которому отражаются результаты нашего поиска. В моем случае он будет выглядеть следующим образом:

    [php]www.google.com/search?hl=ru&gl=ru&tbm=nws&authuser=0&q=%D0%B0%D1%80%D0%BA%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9+%D1%88%D0%B5%D0%BB%D1%8C%D1%84&gs_l=news-cc.3..43j43i53.17897.17897.0.18075.1.1.0.0.0.0.114.114.0j1.1.0…0.0…1ac.2.S8ytfNqqsUc[/php]

В него включено множество операторов, назначение которых я сам не понимаю, но мои эксперименты показали, что если убрать все лишние операторы и значения операторов, то результаты поиска будут аналогичными. В итоге оставляем следующий URL:

    [php]www.google.com/search?&tbm=nws&q=%D0%B0%D1%80%D0%BA%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9+%D1%88%D0%B5%D0%BB%D1%8C%D1%84[/php]

Если вы перейдете по данному адресу то увидите все новости Google по запросу арктический шельф, то есть именно в том виде, в котором они нам нужны. Дело осталось за малым — прикрутить к новостям RSS, чтобы можно было добавить поток в нашу читалку.

Подписка на RSS Google News

Функция подписки на новости через RSS раньше была штатной. В Google висела небольшая иконка нажав на которую можно было подписаться на новости по интересующему запросу. В 2013-м году её убрали однако функционал сохранился.

Чтобы добавить отображение найденных результатов в нашему сокращенному URL необходимо изменить полученный нами адрес следующим образом:

  1. Заменить часть адреса, содержащую www.google.com/search?&tbm=nws& на news.google.com/news? вплоть до каждого знака.
  2. Добавить в конце адреса оператор &output=rss без пробелов и других знаков.

Таким образом полный адрес RSS для моего примера арктический шельф будет выглядеть так:

    [php]news.google.com/news?q=%D0%B0%D1%80%D0%BA%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9+%D1%88%D0%B5%D0%BB%D1%8C%D1%84&output=rss[/php]

Если его скопировать и вставить в программу для чтения RSS-лент, то получим список новостей от Google в обратном хронологическом порядке, т.е. так, как они и должны появляться. Новости будут приходить с разных сайтов по мере их публикации и настройкам вашего ридера.

Вся эта процедура может показаться весьма сложной и путаной, но это в основном из-за нечитабельного адреса, в котором к тому же присутствуют символы кириллицы переведенные на латиницу. Наш запрос арктический шельф в кодировке выглядит так

    %D0%B0%D1%80%D0%BA%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9+%D1%88%D0%B5%D0%BB%D1%8C%D1%84

и занимает самую длинную часть URL. Чтобы избежать путаницы и поступить совсем просто попробуйте сделать иначе. Введите в RSS-ридер адрес следующего вида:

    news.google.com/news?q=арктический+шельф&output=rss

Если всё будет работать — замените в этом адресе арктический+шельф на нужную вам тему и пользуйтесь! Оператор «+» (без кавычек) используйте для запросов, состоящих из нескольких слов. Удачных экспериментов! Если есть вопросы, задавайте в комментариях.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *