Что такое "sitemap"? Процитирую Google:
Файл Sitemap - это список страниц вашего веб-сайта. Создание и отправка файла Sitemap позволяют обеспечить наличие данных в системе Google обо всех страницах на вашем сайте, включая URL-адреса, которые невозможно обнаружить в ходе стандартного процесса сканирования.Одним словом - это то, что помогает поисковой системе лучше и успешнее индексировать ваш сайт. Ранее некоторые пытались скормить sitemap для Google в виде их RSS потока. Но тут есть нюанс - в этом случае индексируются только 25 (или двадцать, уже не помню точно) последних сообщений. Был и ещё какой-то не особенно эффективный способ - его я тоже не могу сейчас вспомнить. Самый распространённый и действенный способ - это сделать sitemap на сто сообщений. Больше за один sitemap не выйдет. Почему больше не получится уже не помню - кажется из-за того, что больше не получится выдать в канале. Для этого надо дать Google'у sitemap следующего вида:
http://www.bugtrack-online.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=100Этот sitemap будет действовать для первых ста страниц блога. Но можно добавлять сразу несколько карт сайта, поэтому никто нам не мешает добавить, не теряя времени, и на будущее:
atom.xml?redirect=false&start-index=101&max-results=100У Google эти sitemap прекрасно работают и индексируются - я сам этим пользуюсь.
atom.xml?redirect=false&start-index=201&max-results=100
atom.xml?redirect=false&start-index=301&max-results=100
А вот Яндекс пишет: "Невалидный XML". При этом тот сайтмэп что Яндекс автоматически ставит себе для блоггера (говоря что он нашёл его в robots.txt), т.е.
http://www.bugtrack-online.blogspot.com/feeds/posts/default?orderby=updatedИм также не индексируется и выдаёт ту же самую ошибку. Меня ещё позабавило то, что в моём блоге, где сейчас порядка 98 постов, Яндекс насчитал аж 369 страниц, находящихся в его индексе. Это потому, что у нас есть страницы с адресом вида:
http://www.bugtrack-online.com/2008/05/blog-post_28.html?widgetType=BlogArchive&widgetId=BlogArchive1&action=toggle&dir=close&toggle=YEARLY-1199138400000&toggleopen=MONTHLY-1209589200000,MONTHLY-1222808400000А многие об этом даже не подозревают!
Спасибо за статью! Проверил на своём блоге - теперь он прекрасно индексируется!
ОтветитьУдалитьСам когда узнал о таком способе был несказанно рад ибо до этого очень много мучался с sitemap'ом...
ОтветитьУдалить