31 января 2010 г.

Как добавить Sitemap для Blogger?

Если мы уже зарегистрировались в Google Webmasters Tools и Яндекс.Вебмастер - то мы должны знать о том, что там есть графа "добавить sitemap для сайта".

Что такое "sitemap"? Процитирую Google:
Файл Sitemap - это список страниц вашего веб-сайта. Создание и отправка файла Sitemap позволяют обеспечить наличие данных в системе Google обо всех страницах на вашем сайте, включая URL-адреса, которые невозможно обнаружить в ходе стандартного процесса сканирования.
Одним словом - это то, что помогает поисковой системе лучше и успешнее индексировать ваш сайт. Ранее некоторые пытались скормить sitemap для Google в виде их RSS потока. Но тут есть нюанс - в этом случае индексируются только 25 (или двадцать, уже не помню точно) последних сообщений. Был и ещё какой-то не особенно эффективный способ - его я тоже не могу сейчас вспомнить. Самый распространённый и действенный способ - это сделать sitemap на сто сообщений. Больше за один sitemap не выйдет. Почему больше не получится уже не помню - кажется из-за того, что больше не получится выдать в канале. Для этого надо дать Google'у sitemap следующего вида:
http://www.bugtrack-online.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=100
Этот sitemap будет действовать для первых ста страниц блога. Но можно добавлять сразу несколько карт сайта, поэтому никто нам не мешает добавить, не теряя времени, и на будущее:
atom.xml?redirect=false&start-index=101&max-results=100
atom.xml?redirect=false&start-index=201&max-results=100
atom.xml?redirect=false&start-index=301&max-results=100 
У Google эти sitemap прекрасно работают и индексируются - я сам этим пользуюсь.
А вот Яндекс пишет: "Невалидный XML". При этом тот сайтмэп что Яндекс автоматически ставит себе для блоггера (говоря что он нашёл его в robots.txt), т.е.
http://www.bugtrack-online.blogspot.com/feeds/posts/default?orderby=updated
Им также не индексируется и выдаёт ту же самую ошибку. Меня ещё позабавило то, что в моём блоге, где сейчас порядка 98 постов, Яндекс насчитал аж 369 страниц, находящихся в его индексе. Это потому, что у нас есть страницы с адресом вида:
http://www.bugtrack-online.com/2008/05/blog-post_28.html?widgetType=BlogArchive&widgetId=BlogArchive1&action=toggle&dir=close&toggle=YEARLY-1199138400000&toggleopen=MONTHLY-1209589200000,MONTHLY-1222808400000
А многие об этом даже не подозревают!

2 комментария:

  1. Спасибо за статью! Проверил на своём блоге - теперь он прекрасно индексируется!

    ОтветитьУдалить
  2. Сам когда узнал о таком способе был несказанно рад ибо до этого очень много мучался с sitemap'ом...

    ОтветитьУдалить