Генератор sitemap xml для яндекса. Как создать Sitemap XML для "Яндекса" и Google: пошаговая инструкция. Как сделать sitemap с помощью Xenu

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Предположим у вас есть сайт, забитый уникальным контентом, на котором проведена SEO оптимизация и сидите вы, потирая ладошки в ожидании, когда же ваше детище начнет посещаться поисковым роботом, индексироваться и приносить заветный трафик. Идет время, а результат ваших стараний не особо-то и виден. В чем же дело? Возможно, что-то все же было упущено из виду, что-то да забылось в погоне за ништяками. Предположим, что сайт по-прежнему уникальный и оптимизаторы из вас хоть куда. Тогда нужно разбираться, почему поисковик так неохотно вас посещает и по какой причине все происходит так медленно.

Каждый web-проект должен иметь два важных, а может и основных файла: это роботс (robots.txt) и карта сайта (). Если какой-то из них отсутствует или неверно заполнен, велика вероятность, что ресурс не даст того результата, на который вы рассчитывали. Ведь у поисковых ботов есть заданные ограничения как по времени нахождения на ресурсе, так и по количеству документов, которые они могут проверить и занести в базу. А это все к тому, что если вами не были заданы пути перемещения для поискового робота, то он может добраться до контента очень нескоро, перед этим побродив в файлах движка.

Чтобы избежать подобной неразберихи, в файле роботс мы говорим, на что ботам не стоит тратить время, а с помощью карты сайта, наоборот, подсказываем куда следует заглянуть и где побродить.

Предположим, что у нас все срослось и поисковики начали индексировать наш проект, а вот отсутствие второго может затянуть достижение поставленных целей. А теперь подробнее про создание sitemap.

XML и HTML версии карты сайта

Sitemap.html выступает в роли навигации для гостей нашего ресурса, которая помогает понять структуру сайта и найти интересующий их раздел.

Sitemap.xml подсказывает и помогает поисковым ботам обнаружить и начать индексировать страницы нашего проекта. Если мы имеем большой уровень вложенности и многочисленное количество веб-страниц на сайте, XML гарантирует, что боты не упустят из вида, то что нужно проиндексировать. Как приятный бонус мы получаем плюсик к карме в виде увеличения доверия к ресурсу со стороны поисковиков.

Положительные стороны присутствия sitemap. xml на сайте

  • ускоренное индексирование недавно созданных страниц;
  • стопроцентная вероятность того что поисковик отыщет необходимые страницы;
  • возможность указать приоритеты при проверке, частоту и дату последнего обновления страницы;
  • немного увеличивается доверие к ресурсу.

Важно!

  • используйте для карты сайта кодировку UTF-8 ;
  • вес файла должен быть не более 10 MB и его содержание не должно быть больше 50 тысяч URL .

Как создать и добавить sitemap. xml на сайт

Берем любой текстовый редактор, например Notepad++, и начинаем творить.

Первым блоком идет стандартная часть, в которой мы указываем:

http://Наш сайт.ru/ 2016-05-23T23:45:36+00:00 daily 1.0

Значения тегов:

  • «loc» - в него мы заключили адрес страницы нашего сайта, которую в скором времени должны проиндексировать поисковые роботы;
  • «lastmod» - отображается последняя дата обновления страницы указанной в первом теге;
  • «changefreq» - показывает как часто будет обновляться контент (в нашем случае каждый день);
  • «priority» - задает приоритетность к индексации страницы (от 0 до 1)

Сохраняем получившийся файлик в формате XML и помещаем его в . Далее указываем путь к нему в robots. txt прописывая данную строчку:

http://Наш сайт/sitemap.xml

Либо мы можем использовать один из онлайн-генераторов. Например, , который рассчитан на создание не больше чем 500 страниц. Но зачастую больше и не надо, поэтому работаем с ним.

В первую строку вписываем полный URL нашего сайта с http://Наш сайт.

Вторая строка, которая называется « Change frequency», показывает поисковым роботам, как часто будут обновляться веб-страницы. Можем выбрать: never, weekly, daily, hourly, monthly, yearly.

Третья строка « Last modification » показывает, когда последний раз обновлялась страница, можем выбрать либо дату когда мы решили создать карту сайта, либо выбрать « Use server’s response » - тогда генератор автоматически внесет дату последнего изменения.

И четвертая строка « Priority», как мы уже ранее обсуждали позволяет выбрать приоритет к индексации, выбираем « Automatically Calculated Priority ».

Нажимаем кнопку «Start» и ждем когда сгенерируется карта сайта в формате XML , после опять проделываем манипуляции с помещением в корень и указания пути в robots.txt.

Как сообщить о файле sitemap после создания Google и Яндекс

Заходим в Вебмастер и действуем следующим образом.

Выбираем проверку карты сайта:

И задаем путь к нашему файлу sitemap.

Проверяем что получилось:

Убеждаемся, что все в порядке и отправляемся на поклон к Google.

Для того чтобы попасть в Search Console Гугл, в которой, собственно, и можно сообщить о нашей карте, переходим

Обновляем страницу - перед нами результат проверки и если в колонке «Проблемы» стоит прочерк, значит, мы все сделали правильно.

Подведем итоги

Создать и разместить файл sitemap. xml на ресурсе по факту минутное дело, для этого можно использовать любой текстовый редактор или онлайн-генератор. Если у вас есть карта сайта на своем ресурсе вы ускоряете и упрощаете жизнь поисковому роботу, который следует по указанному пути и индексирует нужные страницы. Это значит, что результат вашей работы по оптимизации имеет шанс быстрее стать заметным. Но важно не забывать про карту сайта и периодически ее обновлять, т.к. страница может перестать участвовать в продвижении, а боты будут продолжать ее посещать, что отразится на позициях. Также наш XML-проводник может служить помощником не только роботам, но и воришкам контента, ведь в sitemap мы указываем нужные нам документы, что значительно упрощает жизнь копипастерам. Поэтому рекомендуем периодически проверять контент вашего ресурса на уникальность. Соблюдая эти правила вы повышаете доверие поисковых систем Google и Яндекс к своему ресурсу.

You can very easy create your sitemap. First type in your URL and then select the parameters you may wish to change. (change frequency, last modification date and page priority. You may also alter default settings for exclude extensions, do not parse extensions and session ids. In the next fields you can declare which URLs you want to exclude from sitemap (see example below). Finally you may select the maximum number of pages and the depth level. Optionally you can select to create additional sitemaps, like ROR sitemap, HTML sitemap or TXT sitemap.

What is "Page changing frequency" ?
Change frequency affects when and how often search engine spiders visit your site’s pages. It may have one of seven values: always, hourly, daily, weekly, monthly, yearly, never. This tells the search engines how often each page is updated. An update refers to actual changes to the HTML code or text of the page.

What is "Last modification date" ?
This parameter can take one of the next three values:
Server"s response. Set the date of last modification of the file using server response headers. This value, gives crawlers the information to not recrawling documents that have not changed. We recommend to keep this setting.
Current time. Set the date of last modification of the file using the current date and time.
None. Do not use any value for Last modification of the files.

What is "Page priority" ?
The Priority is set to a number between zero and one. If no number is assigned, priority is set to 0.5. This number determines the priority of a particular URL relative to other pages on the same site. A high priority page may be indexed more often and appear above other pages from the same site in search results. Automatic priority reduces the priority of a page depending on depth level.

What is "Depth Level" ?
Depth level of a page means how many clicks away is this page from homepage.

What is "Exclude extensions" ?
Files with these extensions found in your website pages are not included in sitemap (not crawled). Separate input values with spaces.

What is "Do not parse extensions" ?
Files with these extensions will not be fetched in order to save bandwidth, because they are not html files and have no embedded links but will be included in the sitemap. Separate input values with spaces.

What is "Session IDs" ?
If URLs on your site have session IDs in them, you must remove them. Including session IDs in URLs may result in incomplete and redundant crawling of your site. Common session IDs: PHPSESSID, sid, osCsid. Separate with spaces.

What is "Exclude URLs" ?
URLs that contain these strings (or regex) will not be included on sitemap. Input values one per line.
e.g. 1 Use string: component/ in order to exlude all pages in www.yoursite.com/component/
If regex, add in the end: \s* (example: blo\s*)
e.g. 2 If you have any of the following websites, you may exclude these strings: (copy and paste to Exlude URLs box)

Для создания карты сайта необходимо зарегистрироваться



Существует два типа карт сайта: sitemap.xml и sitemap.html .

Xml карта сайта (sitemap.xml)

Xml карта сайта создается для поисковых роботов. С помощью xml карты Вы можете указать, как часто следует индексировать ту или иную станицу, как часто она обновляется, насколько она важна в рамках Вашего сайта. С помощью карты сайта фиксируются все ссылки, которые есть на сайте.

Иными словами, структура сайта становится прозрачной для поисковых роботов. Для «живых» пользователей xml карта бесполезна.

Если Вам нужна только xml карта, то ее можно без труда сгенерировать автоматически, используя один из многих интернет-ресурсов. На большинстве из них создание карты для сайта до 100 страниц бесплатно. Процесс генерации занимает определенное время: чем больше страниц у сайта, для которого Вы генерируете сайт-мэп, тем длительнее этот процесс. Он может занять от нескольких минут (для небольших сайтов) до часа и более (для сайтов с сотнями страниц и многочисленными перекрестными ссылками).

Необходимо помнить , что при любых изменениях, которые затрагивают структуру сайта или приоритет страниц, необходимо заново генерировать sitemap.

Для того, чтобы поисковый робот нашел Вашу sitemap.xml, в файле robots.txt необходимо указать путь к ней.

Html карта сайта (sitemap.html)

Html карта сайта создается для посетителей Вашего сайта, она аналог оглавления в книге. Часто бывает, что при сложной или не очень прозрачной структуре посетитель теряется в навигации по сайту и не доходит до страниц (он их просто не находит), которые ему были бы нужны и уходит с сайта неудовлетворенный. Конверсия сайта при этом снижается.

Если html карта есть и сделана качественно, правильно и емко озаглавлены разделы, то любой раздел, любая страница сайта нужной тематики легко отыщется посетителем Вашего сайта.

Создание sitemap онлайн на нашем сайте

Используя предлагаемый модуль Вы сможете одновременно создать sitemap.xml и sitemap.html.

При этом Вы создаете только html карту сайта, а xml карта создается автоматически.

Изменения, которые вносятся в структуру сайта после создания карты сайта, не требуют новой генерации sitemap.xml, xml карта корректируется автоматически после корректировки html карты. Таким образом, у Вас на сайте всегда будет корректная карта для поисковых машин (sitemap.xml) и корректное оглавление (sitemap.html).

Сравнение автоматической генерации sitemap и полуавтоматической

  • Настраиваемый внешний вид и css стили.
  • Настраиваемая древовидная система.
  • Полная настройка под поисковые системы.
  • Все внесённые данные сохраняются.
  • Корректировка готовой карты сайта займёт не больше минуты.
  • Интуитивно понятный интерфейс.
  • Автоматическая проверка доступности страницы (исключает ошибки и дубли).
  • Title страницы программа считывает самостоятельно.
  • Html карта автоматически добавляет к каждой ссылке title страницы.
  • Для добавления на сайт достаточно скопировать код или скачать файл.
  • Одновременное создание html и xml sitemap.

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Наличие xml карты сайта () на сервере - стратегически важно для оптимизации. Карта хранит в себе структуру актуальных страниц вашего ресурса и служит для того, чтобы поисковые роботы быстрее ориентировались по сайту, а ваши страницы быстрее индексировались. Иными словами: карта сайта указывает поисковым роботам кратчайший путь к страницам. Вот такая карусель.

Что конкретно находится в карте сайта?

Файл sitemap. xml содержит не только url страниц, но и дополнительную информацию каждой страницы:

  • дату последнего изменения;
  • частоту изменения;
  • приоритетность на уровне сайта.

Естественно, прописать ручками этот файл очень трудно. Особенно если у вас большой интернет-магазин. Для упрощения жизни был разработан онлайн генератор карты сайта (sitemap generator online) , который выполняет всю рутинную работу за вас.

На данный момент существует достаточно много ресурсов для генерации карты, в этой статье я расскажу о наиболее популярных онлайн генераторах .

Как сгенерировать sitemap и как работает эта адская система?

Практически все сервисы о нлайн генерации карт сайта работают по одному и тому же принципу. Даже интерфейс примерно везде один и тот же, отличается только стиль оформления и расположение кнопок управления.

Итак вы заходите на типичный онлайн генератор… что вы скорее всего увидите? Правильно! Поле ввода url. Вставляем нужный нам сайт. Для примера будем использовать генератор карты сайта cy-pr.com.

Вводим адрес нашего сайта, выбираем частоту обновления (если оно вам надо), также для удобства можно использовать дату последнего обновления (чтобы запомнить когда создавалась карта) и нажимаем кнопку «Создать».

После нажатия происходит волшебство! Вы сможете наблюдать как трудолюбивый сервис бегает по вашему сайту, записывая каждую страницу в файлик. После такого марафона генератор карты выдает вам всю свою рукопись с описанием каждой страницы:

Теперь нам нужно ее сохранить. Для этого открываем блокнот, вставляем туда наш код, который нам дала адская система, нажимаем «сохранить как», далее вводим имя файла « sitemap.xml », выбираем тип «все файлы», выбираем кодировку utf-8 и нажимаем кнопку «сохранить».

Мы получили файлик sitemap.xml:)

Будьте внимательны с регистрами! Название карты сайта должно быть в нижним регистре

Если вы все сделали правильно то получите такой файлик:

Важно помнить, что карта сайта не резиновая - потолок 50 000 url. Готовую карту можно скидывать на сервер. Главное, не забудьте прописать в robots, что у вас есть карта! Роботы вредные и не будут ее сами искать:)

Если вы решили не использовать сервисы онлайн генерации карты сайта , а захотели пойти по хардкору и написать все сами, то вам следует знать каждого из этого списка:

  1. - Тег в котором указывается данные об url
  2. - В этом теге заключаются данные о многих url
  3. - Используется для указания url
  4. - Хранит дату последнего изменения
  5. - Данные о частотности изменения (могу использоваться атрибуты « always, hourly, daily, weekly, monthly, yearly, never» )
  6. Описывает приоритет страницы по сравнению с другими (от 0.1 - холоп до 1 - царь)

, и являются обязательными, остальные могут не использоваться.

Могучий пример

//сайт/ 2016-06-09T11:46:13+04:00 always 1.0 //сайт/category/ 2016-06-09T11:46:13+04:00 hourly 0.8 //сайт/page/ 2016-06-09T11:46:13+04:00 daily 0.6

Не царское это дело, файлики сохранять

Конечно, не все онлайн генераторы дают вам код, многие генерируют готовую карту сайта в виде файла « sitemap.xml », вам остается лишь скачать ее и закинуть в корень сайта.

А если вы чувствуете, что работа с файлами это вообще не для вас…

Решение есть! Sitemap generator для админки без регистрации и смс. Рассмотрим подробнее на примере админки wordpress.

Плагин « Карта сайта» используется для небольших проектов, он выводит не такую подробную информацию как онлайн генераторы холопских файлов, но все же работает.

Для установки переходим в раздел меню плагины > установленные > добавить новый

В поиске вводим «Google sitemaps»

Устанавливаем данный плагин, активируем и (Бац! Wow!) карта сайта создана. Ее можно дополнительно настроить вручную (если вам это понадобиться). Также существует множество других плагинов для генерации карты сайта. Не только для WP, но и для других CMS и с каждым днем их больше и больше.

Генератор sitemap xml: с оветы

  • При создании карты сайта не стоит забывать о размере. Если файл весит больше 10 мб, рекомендуется его разбить на несколько частей. Тем самым вы избавите сервер от перегрузок.
  • Все url необходимо писать единообразно (с www либо без www)
  • Файл карты сайта должен иметь кодировку UTF-8
  • Всегда указывать на пространство имен языка XML xmlns="

С помощью файла Sitemap можно сообщить Яндексу об актуальной структуре сайта, указав специальную директиву в robots.txt или добавив в Яндекс.Вебмастер.

Вебмастер позволяет:

Загрузка Sitemap

    Выберите из списка сайт.

    В поле впишите URL, по которому доступен файл. Например, https://example.com/sitemap.xml .

    Нажмите кнопку Добавить .

После добавления файл попадает в очередь на обработку. Робот загрузит его в течение двух недель. Каждый добавленный файл, в том числе вложенный в файл индекса Sitemap , обрабатывается роботом отдельно.

После загрузки напротив каждого файла вы увидите один из статусов:

Статус Описание Примечание
«OK»
«Редирект» Удалите редирект и сообщите роботу об обновлении
«Ошибка» Файл сформирован неправильно сообщите роботу об обновлении
«Не проиндексирован»

Проверка ответа сервера

Disallow сообщите роботу об обновлении
Статус Описание Примечание
«OK» Файл сформирован правильно и загружен в базу робота

Напротив файла отобразится дата последней загрузки.

Проиндексированные страницы появятся в результатах поиска в течение двух недель

«Редирект» Указанный URL перенаправляет на другой адрес Удалите редирект и сообщите роботу об обновлении
«Ошибка» Файл сформирован неправильно Нажмите ссылку Ошибка , чтобы узнать подробности. После внесения изменений в файл сообщите роботу об обновлении
«Не проиндексирован» При обращении к Sitemap сервер возвращает HTTP-код, отличный от 200

Проверьте, доступен ли файл для робота с помощью инструмента Проверка ответа сервера , указав полный путь к файлу.

Если файл недоступен, обратитесь к администратору сайта или сервера, на котором он расположен.

Доступ к файлу запрещен в robots.txt с помощью директивы Disallow Разрешите доступ к Sitemap и сообщите роботу об обновлении

Обновление Sitemap

Если вы изменили добавленный в Яндекс.Вебмастер файл Sitemap , его не надо удалять и загружать снова - робот регулярно проверяет файл на обновления и ошибки.

Чтобы ускорить обход файла, нажмите значок . Если вы используете файл индекса Sitemap , можно запустить обработку каждого перечисленного в нем файла. Робот загрузит данные в течение трех дней. Использовать функцию можно до 10 раз для одного хоста.

Когда вы израсходуете все попытки, следующая будет доступна через 30 дней после первой. Точная дата отображается в интерфейсе Вебмастера.

Удаление Sitemap

В интерфейсе Яндекс.Вебмастера можно удалить те файлы, которые были добавлены на странице Файлы Sitemap : Если для Sitemap была добавлена директива в файле robots.txt , удалите ее. После внесения изменений информация о Sitemap пропадет из базы робота и Яндекс.Вебмастера в течение нескольких недель.