Rapport sur les fichiers du plan du site. Guide détaillé de la vérification des fichiers de plan de site pour les erreurs dans le fichier XML de plan de site

Avec le rapport Sitemap, vous pouvez soumettre votre plan de site à Google, consulter son historique de soumission et toutes les erreurs rencontrées par notre système lors de l'analyse de votre plan de site.

Qu'est-ce qu'un fichier Sitemap ? Ai-je besoin de ce type de rapport ?

Fichier de plan du site est placé sur votre site Web et contient des informations sur toutes ses pages Web nouvelles et modifiées. Si votre ressource est petite (moins de 100 pages), il vous sera peut-être plus facile de demander l'indexation de la page principale, à condition qu'elle (ou l'une des pages vers laquelle elle renvoie directement ou via d'autres pages) ait des liens vers toutes les autres pages.

Gérer les plans de site

Comment soumettre un plan de site

Suivez ces étapes :

  1. Placez un plan du site sur votre site. Exigences:
    • Le fichier du plan du site doit être au format .
    • Le fichier du plan du site doit être accessible à Googlebot.
  2. Vous devez avoir l'autorisation du propriétaire. S'il n'existe pas, vous pouvez ajouter un lien vers celui-ci dans votre fichier robots.txt au lieu d'envoyer le fichier.
  3. Fournissez l'URL relative du fichier sur la page du rapport Sitemap et cliquez sur Envoyer.
  4. Le traitement du fichier Sitemap commencera immédiatement. Veuillez noter que l'exploration des URL répertoriées ici peut prendre un certain temps. Parfois, toutes les URL ne peuvent pas être explorées (cela dépend de la taille du site, du trafic et d'autres facteurs).

Attention!

Si vous nous avez déjà envoyé un plan du site, vous n'avez pas besoin de le renvoyer, même si vous y avez apporté des modifications (nous les remarquerons la prochaine fois que nous explorerons votre site).

Comment supprimer un plan de site

Si vous supprimez un plan Sitemap, il sera supprimé du rapport correspondant, mais restera dans Google, ainsi que toutes les URL qui y étaient incluses. Si vous souhaitez que les robots Google arrêtent de visiter vos pages Web, ajoutez une règle à votre fichier robots.txt.

Pour supprimer un fichier de plan de site, procédez comme suit :

Comment interpréter le rapport

  • Le rapport affiche uniquement les sitemaps soumis à l'aide de celui-ci, et non ceux détectés via des liens dans le fichier robots.txt ou par d'autres moyens. Cependant, si nous avons déjà reçu votre plan Sitemap d'une autre source, vous pouvez toujours nous l'envoyer via ce rapport afin que nous puissions vérifier l'exactitude des données et déterminer le taux d'erreur.
  • Le rapport affiche uniquement les plans Sitemap liés à la propriété actuelle.
  • Vous pouvez inclure des URL d'images, de vidéos et d'articles d'actualité dans votre plan de site. Cependant, le rapport n'affiche actuellement aucune information sur ces types d'adresses.

Les informations suivantes sont fournies pour chaque fichier Sitemap :

URL du plan du site L'adresse où se trouve le fichier, par rapport au répertoire racine de la ressource. Taper Type de fichier de plan du site. Valeurs possibles :
  • Plan du site– un fichier XML standard ou un fichier de plan de site texte.
  • Fichier d'index du plan du site– un fichier Sitemap contenant des informations sur d’autres fichiers Sitemap.
  • RSS– Fichier plan du site au format flux RSS.
  • Atome– Fichier de plan du site au format de flux Atom.
  • Inconnu– le fichier a un format inconnu ou n'a pas encore été traité.
Envoyé Date à laquelle le plan du site a été soumis pour la dernière fois à Google. Date du dernier traitement Date à laquelle le plan du site a été traité pour la dernière fois par les outils Google. Statut Envoyer ou scanner le statut. Valeurs possibles : Nombre d'URL identifiées Le nombre d'URL répertoriées dans le plan du site. S'il s'agit d'un fichier de plan de site d'index, cela indiquera le nombre total d'URL dans tous les fichiers qu'il contient. Les URL en double ne sont comptées qu'une seule fois.

Cliquer sur cette icône ouvre les détails de la couverture pour toutes les URL du rapport. Dans le cas d'un index de plan de site, toutes les URL répertoriées dans ses plans de site enfants sont répertoriées.

Mon plan de site n'est pas répertorié

  • Voici quelques raisons pour lesquelles un plan du site peut manquer dans un rapport : Il appartient à une ressource différente.
  • Les plans de site associés à une propriété ne sont pas disponibles pour les autres. Par exemple, les fichiers du domaine http://example.com ne seront pas signalés pour les domaines http://m.example.com ou https://example.com. Pour résoudre ce problème, assurez-vous d'inclure toutes les versions de l'URL de votre ressource. Vous n'avez pas envoyé de plan de site à Google à l'aide du rapport.

Si vous avez soumis des sitemaps en utilisant une autre méthode, ils ne seront pas répertoriés, même si Google peut les trouver et les utiliser.

Erreurs dans les plans de site

Les erreurs suivantes peuvent apparaître dans le rapport Plan du site :

Google n'a pas pu explorer toutes les URL répertoriées dans le plan du site. Raisons possibles :

  • Il y a trop de redirections vers l'URL. Nous vous recommandons de remplacer ces URL par des adresses pouvant être explorées directement.
    • Si vous redirigez constamment d’une page à une autre, utilisez une redirection finale.
    • Nous vous recommandons de désactiver les redirections à l'aide de JavaScript ou de la balise méta d'actualisation.
  • Les Googlebots ne peuvent pas explorer les URL relatives dans votre plan de site. Dans la mesure du possible, utilisez des liens absolus plutôt que relatifs. Par exemple, lorsque vous créez un lien vers une autre page de votre site, utilisez l'URL https://www.example.com/moya-stranitsa.html plutôt que simplement moya-stranitsa.html.

URL invalides

Certaines URL se trouvent à un niveau supérieur au plan du site ou sur un domaine différent.

Niveau supérieur. Si le fichier se trouve sur http://www.example.com/mysite/sitemap.xml , les URL suivantes ne sont pas valides pour celui-ci :

  • http://www.example.com/ – se situe à un niveau supérieur au fichier Sitemap ;
  • http://www.example.com/yoursite/ – situé dans un répertoire enfant du fichier Sitemap (vous devez passer à un niveau supérieur puis à un niveau inférieur).

Un autre domaine. Assurez-vous que toutes les URL commencent par le domaine où votre plan de site est stocké. Par exemple, si le fichier se trouve sur la page http://www.example.com/sitemap.xml, les URL suivantes ne sont pas valides pour celui-ci :

  • http://example.com/ – www manquant au début.
  • www.example.com/ – pas de préfixe de protocole (http).
  • https://www.example.com/ – le protocole est https au lieu de http.

Erreur de compression

Erreur lors de la tentative de décompression d'un fichier Sitemap compressé. Effectuez à nouveau la compression (par exemple en utilisant gzip), puis téléchargez-le sur votre site et soumettez-le à nouveau à Google.

Plan du site vierge

Le plan du site ne contient pas d'URL. Assurez-vous qu'il n'est pas vide.

Taille maximale autorisée du fichier de plan de site dépassée

La taille du fichier Sitemap non compressé dépasse 50 Mo. Divisez-le en plusieurs fichiers et indexez-les, puis envoyez-nous chacun séparément.

Valeur d'attribut invalide

L'attribut associé à l'une des balises XML du plan du site a une valeur non valide. Examinez les plans de site pour vous assurer que tous les attributs sont utilisés conformément aux spécifications du plan de site. Vérifiez les fautes de frappe dans les valeurs d'attribut.

Date invalide

Une ou plusieurs dates dans le plan du site ont un format ou une valeur incorrecte. Les dates doivent être au format de codage datetime W3C. L'heure ne peut pas être précisée. Assurez-vous que toutes les dates sont écrites dans l'un des formats d'encodage W3C valides.

2005-02-21 2005-02-21T18:00:15+00:00

Il n'est pas nécessaire de régler l'heure (la valeur par défaut est 00:00:00Z), mais si vous le faites, assurez-vous de spécifier le fuseau horaire.

Valeur de balise invalide

Le plan du site contient une ou plusieurs balises avec une valeur non valide. Vérifiez les spécifications du type de fichier de plan de site approprié (index, standard, vidéo, etc.).

URL invalide

Le plan du site contient une URL non valide. Il peut contenir des caractères non valides (espaces, guillemets, etc.) ou d'autres erreurs de formatage, comme le préfixe htp:// au lieu de http:// .

L'URL de l'icône vidéo est manquante

Il manque un lien vers l'icône vidéo dans une ou plusieurs publications vidéo. Assurez-vous que les balises Les URL de toutes ces icônes sont indiquées.

Le titre de la vidéo est manquant

Certaines entrées vidéo n'ont pas de titre. Assurez-vous que les balises Les noms de toutes les vidéos sont indiqués.

Format d'index du plan du site incorrect : sous-fichiers d'index du plan du site

Une ou plusieurs entrées du fichier d'index de plan de site contiennent sa propre URL ou l'URL d'un autre fichier d'index de plan de site. Le fichier d'index du plan Sitemap ne peut contenir que des liens vers des plans Sitemap standards, pas des index.

Supprimez les entrées pointant vers les index du plan du site et soumettez à nouveau le fichier.

Erreur d'analyse

Google n'a pas pu analyser le contenu XML de votre plan de site.

Cela se produit souvent en raison de caractères non échappés dans l'une des URL. Comme pour les fichiers XML, toutes les valeurs de données (y compris les URL) doivent utiliser des codes d'échappement pour certains caractères, tels que & " "< >. Vérifiez si l'échappement d'URL est configuré correctement.

Erreur temporaire

Le fichier du plan du site n'a pas pu être traité en raison d'une erreur système temporaire. En règle générale, si cette erreur se produit, il n'est pas nécessaire de renvoyer le fichier. Googlebot tentera de le récupérer plus tard. Si ce message d'erreur continue de s'afficher après plusieurs heures, veuillez soumettre à nouveau le plan du site.

Trop de plans de site dans le fichier d'index

Il y a plus de 50 000 plans Sitemap dans le fichier d'index. Divisez-le en plusieurs et assurez-vous que chacun ne contient pas plus de 50 000 plans Sitemap.

Trop d'URL dans le plan du site

Il y a plus de 50 000 URL dans le plan du site. Divisez-le en plusieurs, chacun contenant jusqu'à 50 000 adresses. Pour plus de commodité, vous pouvez créer un fichier d'index de plan Sitemap.

Format de fichier non pris en charge

Vous avez créé un fichier incorrect.

Pour éviter les erreurs XML les plus courantes, vérifiez les points suivants :

  • Les plans de site doivent avoir les en-têtes corrects. Par exemple, si le contenu du fichier représente des informations sur une vidéo, le titre doit être le suivant :
  • L'espace de noms dans l'en-tête devrait ressembler à http://www.sitemaps.org/schemas/sitemap/0.9(Pas .9 ).
  • Tous les attributs XML doivent être placés entre guillemets simples ("") ou doubles (""), qui ne doivent être que des guillemets droits. Attention! Les éditeurs de texte tels que Microsoft Word peuvent automatiquement les remplacer par des textes bouclés.

Chemin invalide : préfixe www manquant

Le chemin du fichier du plan du site ne contient pas le préfixe www (par exemple, http://example.com/sitemap.xml), mais toutes les URL répertoriées dans le fichier ont ce préfixe (par exemple, http://www.example. com/monfichier.html ).

Modifiez votre plan de site pour supprimer le préfixe www de toutes les URL.

Chemin invalide : le préfixe www est présent

Le chemin du fichier du plan du site contient le préfixe www (par exemple, http://www.example.com/sitemap.xml), mais ce préfixe n'est pas présent dans toutes les URL répertoriées dans le fichier (par exemple, http:// exemple.com/myfile.xml) .

Modifiez votre plan de site pour ajouter le préfixe www à toutes les URL.

Espace de noms incorrect spécifié

L'élément racine du fichier Sitemap comporte un espace de noms incorrect ou manquant, une faute d'orthographe ou une URL incorrecte.

Assurez-vous que l'espace de noms est correctement défini en fonction du type de fichier. Exemple:

  • Fichier de plan du site : xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Plan du site vidéo : xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Déposer indice Plan du site :

Le fichier de plan du site commence par un espace

Votre fichier Sitemap commence par un espace, pas un espace de noms. Les fichiers XML doivent commencer par une déclaration XML qui spécifie la version de XML à utiliser.

Cette erreur n'empêchera pas Google de traiter votre Sitemap, mais il est préférable de supprimer l'espace pour que le fichier soit conforme aux normes XML et ce message d'erreur n'apparaîtra plus.

Erreur HTTP ( code spécifique)

Une erreur HTTP s'est produite lors de la tentative de téléchargement du plan du site. Le message à ce sujet indiquera un code d'état (par exemple, 404). Assurez-vous que l'URL du plan du site est correcte et que le fichier se trouve à l'emplacement spécifié. Ensuite, soumettez-le à nouveau à Google.

L'icône de la vidéo est trop grande

L'icône vidéo fournie dans le plan du site est trop grande. Redimensionnez-le à 160 x 120 pixels. Si nécessaire, mettez à jour votre plan de site et soumettez-le à nouveau à Google.

L'icône de la vidéo est trop petite

L'icône vidéo fournie dans le plan du site est trop petite. Redimensionnez-le à 160 x 120 pixels. Mettez à jour le plan du site si nécessaire.

Les emplacements des pages vidéo et de lecture sont les mêmes

L'URL de la vidéo et la page de lecture spécifiées dans le fichier Sitemap ne doivent pas être identiques. Si les deux balises sont utilisées ( Et ), les URL doivent être différentes.

L'URL de l'emplacement de la vidéo pointe vers la page de lecture

Le fichier de plan du site contient des URL bloquées dans le fichier robots.txt

Googlebot n'a pas pu traiter le plan du site car l'accès à celui-ci ou à son contenu est interdit dans le fichier robots.txt. Utilisez un outil d'inspection d'URL pour découvrir quel fichier est à l'origine du problème et apportez les modifications nécessaires au fichier robots.txt.

Ces informations ont-elles été utiles ?

Comment cet article peut-il être amélioré ?

Dans ce guide, nous aborderons les questions suivantes :

Qu'est-ce qu'un plan du site ?

Il s'agit d'un fichier qui contient une liste de liens vers toutes les pages importantes du site. Autrement dit, ce document dirige les moteurs de recherche vers le contenu principal du site.

Pourquoi avez-vous besoin d'un plan du site ?

Un plan du site est nécessaire si le site rencontre des problèmes d'indexation causés par :
1) un grand nombre de pages ;
2) manque de liens (internes ou externes) vers des pages ;
3) nidification profonde sur le site (structure déroutante).

Plan du site HTML ou XML

Les plans de site sont disponibles dans les types suivants :

  • HTML ;

L'explication la plus simple de la différence entre ces formats est qu'une carte XML est principalement destinée aux moteurs de recherche, tandis que HTML est principalement destinée aux utilisateurs.

Carte HTML– Il s’agit simplement d’un aperçu général du site, contenant uniquement les informations et les pages que les utilisateurs doivent voir. Si vous êtes sur un site Web et recherchez une section spécifique, vous pouvez facilement la trouver lorsque vous accédez au plan du site HTML. Bien que ce type de plan de site soit axé sur l’utilisateur, il peut également améliorer votre classement dans les moteurs de recherche. C'est une preuve que vous vous souciez de l'expérience utilisateur du site.

Lors de la création d’un plan de site HTML, il est important de prendre en compte :

1. Contenu structuré.

Le plan du site doit être clair et facile à comprendre pour l’utilisateur. Il est souhaitable qu'il comprenne des sections, des catégories, des sous-catégories, etc.

2. Liez les ancres.

Protocole Cartes XML Le site est destiné aux robots de recherche. Le fichier XML contient des informations sur la date de la dernière mise à jour de l'URL, son importance et la fréquence des modifications.

Généralement, un plan de site se compose des balises XML suivantes :

Requis:
– définit la norme du protocole et encapsule ce fichier.
– содержит в себе информацию о URL-адресе (является родительским тегом).
https://olegshein.ru/fr/ – содержит абсолютный URL-адрес.

Необязательные:
– указывает дату последнего изменения файла.
– указывает частоту смены файла.
– указывает на значимость документа на сайте. Диапазон значений: от 0,1 до 1,0 (по умолчанию 0,5).

Не устанавливайте для каждого URL-адреса слишком частую смену файла и максимальный приоритет. Если метки частоты и приоритета не отражают реальность, вероятнее всего, поисковые системы будут более склонны игнорировать всю карту XML.

Другие форматы Sitemap

Помимо вышеперечисленных карт сайта, поисковые системы также поддерживают следующие форматы:

Для Google:
— RSS, mRSS и Atom 1.0;
RSS / Atom фиды должны содержать последние обновления вашего сайта. Обычно они небольшие и часто обновляются (что является плюсом).
— Сайты Google.
Для сайтов, созданных на платформе Google Сайты, Sitemap создаётся автоматически, и внести какие-то изменения невозможно.

Для Google и Яндекс:
— текстовый формат (TXT).
Файл должен быть в кодировке UTF-8 и состоять только из URL-адресов.

Требования Google и Яндекса к файлам Sitemap

1. Используйте кодировку UTF-8.
2. Максимальное количество URL – 50 000.
3. Ссылки в сайтмапе должны быть на том же домене, что и файл.

4. Если файл слишком большой, разделите его на несколько и укажите их в файле индекса Sitemap.
5. Ответ сервера при обращении к файлу должен быть 200 ОК.
6. Указывайте только канонические адреса страниц (без GET-параметров и идентификаторов сессий).

1. Максимальный размер – 10 МБ.
2. Поддерживает кириллические URL.

1. Максимальный размер – 50 МБ.
2. Поддерживает только цифры и латинские буквы.

Распространённая ошибка: чтобы уменьшить требования к пропускной способности канала, используют архиватор gzip. Размер сайтмапа должен быть 50 МБ (10 МБ) до сжатия, а не после.

Совет: русские доменные имена можно преобразовать с помощью кодировки Punycode.

Как создать XML Sitemap

1. Чтобы создать карту сайта, в первую очередь нужно определить канонические адреса, которые будут добавлены в файл.

2. Определить, какой формат файла будете использовать.

3. Создать файл можно вручную или, воспользовавшись генератором Sitemap.

Google в своей справке подготовил список онлайн и десктопных, платных и бесплатных генераторов карт сайта. Ознакомиться со всем списком можно, перейдя по ссылке .

Сгенерировать Sitemap проще, чем кажется. Разберём, как сгенерировать сайтмап, на примере деcктопного приложения Majento:

1. Парсим сайт.

2. Переходим в раздел «Сайты» => «Генерировать Sitemap».

3. Сохраняем в нужном нам формате.

4. Карта сайта готова.

Из online-генераторов XML-карты сайта заслуживает внимания XML Sitemap Generator .

Расширенные возможности этого сервера позволяют установить определённые XML-теги, включить/исключить нужные документы.

Исключить ненужные страницы можно и с помощью регулярных выражений.

Google поддерживает расширенный синтаксис для изображений. Для этого вы можете создать отдельную карту сайта для изображений или добавить синтаксис в существующую. Использование расширенного синтаксиса в Sitemap предоставляет поисковой системе дополнительную информацию об изображениях на сайте. Также это может помочь Google обнаружить и проиндексировать изображения, которые он не может найти при сканировании сайта.

Как и в обычной карте сайта, есть обязательные и необязательные XML-теги.

Обязательные:
– аналогично тегу содержит в себе URL изображения и дополнительную информацию.
– URL изображения.

Необязательные:
– подпись к изображению.
– место съёмки фотографии.
– название изображения.
– URL-лицензии изображения.

Ещё один расширенный синтаксис, который поддерживает Google, – XML-карта для видео.

Плюсы добавления XML-тегов для видео:

1) даёт понять Google, какой контент на сайте;
2) даёт возможность предоставить детальное описание к файлу;
3) станет доступным для поиска в Google Видео;
4) в поисковой выдаче будет отображаться заставка видео (может повысить количество переходов из поисковой выдачи).

Карта сайта для видеофайлов состоит из следующих обязательных элементов:

– содержит URL-адрес страницы, на которой размещено видео; если на одной странице размещено более одного видео, не нужно каждый раз создавать тег , достаточно в одном теге несколько раз прописать для каждого видео на странице.
– включает в себя всю информацию о видео.
– URL к миниатюрному изображению (заставке) к видео. Рекомендованные размеры: от 160×90 пикселей до 1920×1080. Форматы изображения: .jpg, .png, or. gif
– заголовок, который должен совпадать с названием страницы, на которой отображается видео.
– описание видео. Должно соответствовать с метаописаниями страницы. Максимальное количество символов – 2048.

Заголовок и описание видео должны быть экранированы или упакованы в блок CDATA.

Со всеми XML-тегами карты сайта для видео можно ознакомиться в справке Google .

Где разместить карту сайта

Распространённые заблуждения о Sitemap

Так как у многих этот файл вызывает трудности и является «тёмным лесом», возникают определённые мифы в отношении карт сайта. Рассмотрим некоторые из них:

– «Включение URL-адреса в файл Sitemap для XML гарантирует, что он будет проиндексирован».
Нет. Важно отметить, что XML-файлы Sitemap – это только рекомендации. Карта сайта XML не гарантирует индексацию поисковыми системами страниц, указанных в файле.

– «Если я удалю URL из XML-карты, он будет удалён из индекса».
Нет. Карта сайта XML не исключает индексацию страниц, не включённых в карту сайта XML.

– «XML-файлы Sitemap трудно создавать и поддерживать»
Нет. Небольшие сайты могут легко создавать и размещать собственные XML-файлы вручную, используя приведённые выше примеры в качестве руководства по форматированию. Для более крупных сайтов и сайтов, которые изменяются чаще, плагины или модули, доступные для большинства CMS, могут автоматизировать обновление XML-файлов.

Заключение

Файл Sitemap – полезный инструмент для передачи поисковым роботам информации о структуре сайта. Используйте это руководство, чтобы понять, как работает карта сайта, как она устроена, как сгенерировать, разместить и проверить файл.

Подписаться на рассылку

Вы просто кретин, если в свое время не уделили сайтмапу нужное внимание. Достаточно один раз разобраться в вопросе и в будущем избежать большого количества ошибок, что давайте сейчас и сделаем.

Ваш покорный слуга в годы младые также был таким кретином, когда только начал продвигать сайты в одной конторе. Попался мне в то время один сайтец на продвижение, который, следует сказать, был просто гавном. И у этого гавна были проблемы с индексацией. Естественно, будь сайт достаточно качественным, его бы оба поисковика индексировали несмотря ни на какие проблемы, но владельцы жались на нормальных дизайнера, верстальщика и программиста, а в этом случае сеошнику остается только, так сказать, открывать бутылку при помощи ножниц. Я перепробовал на нем все — и настройку last-modified, и ускорение индексации модным в то время фастботом, и покупку ссылок. И только потом оказалось, что дело было в том, что там не обновлялся автоматически сайтмап! Когда я его обновил — все страницы влетели в индекс.

Что такое sitemap и зачем он нужен

Что такое sitemap? Это файл с информацией о страницах сайта, которые нужно индексировать. Обычно sitemap создают для Яндекса и Гугла, чтобы оповестить поисковых роботов о страницах, которые нужно внести в индекс. Ещё при помощи сайтмапа осуществляется проверка того, как часто происходят обновления, и индексация каких веб-документов является наиболее важной. В целом очень хорошо о нем рассказали на Вебмастерской Яндекса:

Влияет ли наличие sitemap на продвижение

Если у вас отсутствует сайтмап, это не означает, что поисковики не станут индексировать ресурс. Поисковые роботы зачастую и без этого неплохо сканируют сайты и включают их в поиск. Но иногда могут возникать сбои, из-за которых порой удается отыскать не все веб-документы. Основными причинами являются:

  1. Разделы сайта, в которые можно попасть, только совершив длинную цепочку переходов;
  2. Динамические URL-адреса.

Так вот, создание sitemap.xml во многом помогает решить эту проблему. Этот файл влияет на SEO лишь постольку, поскольку облегчает/ускоряет индексацию страниц. Также возрастает шанс того, что веб-страницы проиндексируются до того, как ваши конкуренты смогут скопировать контент, опубликовав его у себя на сайте.

В каком еще формате бывает карта сайта и почему её делают в формате XML

Зачем нужна карта сайта, мы разобрались. Теперь давайте рассмотрим, в каких форматах её можно сделать:

  1. В формате html. Создается в виде обыкновенной страницы с адресами, ведущими на главные разделы ресурса. Такой тип карты помогает быстро сориентироваться, и рассчитан в большей степени на людей, чем на поисковых роботов. В HTML sitemap можно поместить ограниченное число ссылок (не более 100), ведь если их окажется больше, то не все они попадут в индекс. Или же поисковые роботы могут и вовсе исключить такую страницу из поиска за чрезмерное число URLов, пусть даже и внутренних.
  2. Создание xml-файла sitemap. Здесь нет слишком критичных ограничений по количеству ссылок, а поисковики лучше его индексируют, ведь файл sitemap xml-формата содержит полную информацию в понятном для робота виде. Особенно он важен для проектов, где имеются сотни и тысячи документов одинаковой важности, и размещение всех ссылок на них необходимо. В сайтмап такого типа есть возможность разместить до 50 тысяч URLов и помимо этого можно выставить частоту обновлений и приблизительный приоритет (priority), чего не скажешь о карте в формате HTML. Именно по этим причинам сайтмап почти всегда создают в xml.

Вот еще инфа об этом файле:

Как сделать правильный sitemap

Рассмотрим, как сделать правильную xml-карту. Здесь должны быть соблюдены следующие требования:

  1. Размер файла должен быть не больше 10 мб;
  2. Карта должна содержать не больше 50000 ссылок. В тех случаях, когда ссылок больше, можно создать несколько карт и включить их в главную xml-карту;
  3. Адрес сайтмапа следует прописать в robots.txt;
  4. Также загрузите sitemap в яндекс и гугл (как добавить файл – описано ниже);
  5. Поисковые системы должны иметь доступ к карте. Необходимо использовать специальные теги, которые дают поисковикам понять, что это именно карта, а не что-то другое;
  6. У sitemap должна быть кодировка UTF-8.

Приведу простой пример карты:

http://site.ru/ 2016-11-20T19:45:08+03:00 always 0,9 http://site.ru/category/ 2016-11-20T19:46:38+03:00 monthly 0,6 http://site.ru/page/ 2016-11-20T19:48:41+03:00 yearly 0.4

< url >

< loc >http : //site.ru/

< lastmod >2016 - 11 - 20T19 : 45 : 08 + 03 : 00< / lastmod >

< changefreq >toujours< / changefreq >

< priority > 0 , 9 < / priority >

< / url >

< url >

< loc >http : //site.ru/category/

< lastmod >2016 - 11 - 20T19 : 46 : 38 + 03 : 00< / lastmod >

< changefreq >mensuel< / changefreq >

< priority > 0 , 6 < / priority >

< / url >

< url >

< loc >http : //site.ru/page/

< lastmod >2016 - 11 - 20T19 : 48 : 41 + 03 : 00< / lastmod >

< changefreq >annuel< / changefreq >

< priority > 0.4 < / priority >

< / url >

Les balises url et loc sont obligatoires. Le premier contient toutes les informations sur une URL spécifique. Le second contient l'adresse elle-même.

Les balises lastmod, changefreq, priorité ne sont pas obligatoires, mais il est tout de même recommandé de les utiliser.

Lastmod dans le plan du site est responsable de la date de la dernière mise à jour.

Changefreq indique la fréquence des changements de page. Les valeurs peuvent être les suivantes :

  1. Toutes les heures – mises à jour toutes les heures ;
  2. Toujours – toujours mis à jour ;
  3. Hebdomadaire – mis à jour une fois par semaine ;
  4. Quotidiennement : les mises à jour sont effectuées quotidiennement ;
  5. Mensuel : les mises à jour ont lieu une fois par mois ;
  6. Annuel – une fois par an ;
  7. Jamais – non mis à jour (il vaut mieux ne pas utiliser cette valeur).

La priorité indique aux moteurs de recherche l’importance d’une page par rapport aux autres. La priorité peut être réglée de 0,1 (faible) à 1 (élevée).

Ceci n'est qu'un exemple de carte, vous n'avez pas besoin de spécifier ces valeurs exactes. En général, il est recommandé de définir la priorité comme suit : maximum pour la page principale (1), moyenne pour les catégories (0,6) et minimum pour les publications (0,4).

Regardons maintenant un exemple où il existe plus de 50 000 liens. Dans ce cas, le fichier comprend d'autres cartes :

http://site.ru/sitemaps/sitemap01.xml 2016-11-20T21:37:28+03:00 http://site.ru/sitemaps/sitemap02.xml 2016-11-20T21:37:29+03:00

< sitemap >

< loc >http : //site.ru/sitemaps/sitemap01.xml

< lastmod >2016 - 11 - 20T21 : 37 : 28 + 03 : 00< / lastmod >

< / sitemap >

< sitemap >

< loc >http : //site.ru/sitemaps/sitemap02.xml

< lastmod >2016 - 11 - 20T21 : 37 : 29 + 03 : 00< / lastmod >

< / sitemap >

Comment créer un plan de site

Il existe plusieurs façons de créer une carte XML, examinons-les :

  1. Téléchargez la carte à l'aide d'un générateur en ligne à partir d'une autre ressource ;
  2. Générez à l'aide d'un programme spécial. Mais il convient de noter que les programmes de ce type sont pour la plupart payants. Un exemple d'un tel générateur : Wonder WebWare SiteMap Generator. Screaming Frog possède également cette fonctionnalité ;
  3. Créez un plan de site manuellement ;
  4. Créez automatiquement une carte à l'aide d'un CMS (par exemple, une telle fonction est disponible sur WordPress).

Voici une option sur la façon de créer un plan de site sans l'aide de plugins :

Plugins pour créer des plans de site sur WordPress

Vous pouvez créer un plan de site dans WordPress à l'aide d'un plugin spécial appelé Google XML Sitemaps. Tout est simple ici : téléchargez le plugin, installez-le, puis lancez la création du fichier. Pour ce faire, ouvrez les paramètres de la console et sélectionnez le plan du site XML. Ensuite, nous définissons les paramètres. Nous laissons la priorité par défaut.

Sitemap.xml est un document qui contient des données utilisées par les moteurs de recherche pour indexer des sites. Ce fichier contient des informations sur les pages du site qui doivent être indexées.

Ce document permet aux moteurs de recherche de déterminer l'emplacement du site, la fréquence et l'heure de mise à jour de ses pages, et également d'obtenir une liste complète des documents du site qui doivent être indexés. La présence d'un plan du site (Sitemap.xml) ne garantit pas à 100 % que le site sera entièrement indexé par les moteurs de recherche ; il ne sert que d'un des moyens d'indiquer une liste de pages à explorer. L'utilisation appropriée d'un plan de site aide les optimiseurs dans .

Structure du plan du site.xml

Le fichier est marqué de balises XML dont les principales indiquent :

  • L'importance de la page varie de 0,1 à 1,0 (0,1 étant la priorité la plus basse et 1,0 la priorité la plus élevée).
  • Fréquence de mise à jour (une fois par heure, une fois par jour, une fois par semaine, une fois par mois, une fois par an, jamais ou toujours).
  • Description de la page et de son début (c'est un élément obligatoire du plan du site).
  • Adresse de la page du site Web (c'est également un élément obligatoire du plan du site).
  • La date à laquelle la page a été modifiée pour la dernière fois (il s'agit d'un élément facultatif).

Placement du plan Sitemap.xml

Il existe des règles pour l'emplacement du fichier Sitemap.xml, dont le respect vous permettra d'obtenir les meilleurs résultats dans la promotion de la ressource.

  • Il est recommandé de placer le document Sitemap.xml dans le répertoire racine du site.
  • Tous les liens sur le site doivent être placés sur le même domaine que le fichier Sitemap.xml.
  • Les liens contenus dans le document Sitemap.xml doivent utiliser le même protocole que les liens placés sur le site (http ou https, avec ou sans www.).
  • Vous devez spécifier le chemin d'accès au plan du site.

Plans du site

Il est permis de publier non seulement le document principal Sitemap.xml, mais également des fichiers supplémentaires similaires au document principal. Chacun de ces fichiers ne peut pas contenir plus de 50 000 liens et la taille totale des documents ne doit pas dépasser 10 Mo. Si nécessaire, Sitemap.xml peut être compressé avec un archiveur standard. Des fichiers supplémentaires sont utilisés si la taille du fichier principal est dépassée. Chaque fichier supplémentaire est répertorié dans l'index et son format est identique à celui d'origine.

Utilisation du plan Sitemap.xml

Le document Sitemap.xml est utilisé dans la promotion des moteurs de recherche et est particulièrement important si :

  • Le site est relativement jeune et il existe trop peu de liens y menant à partir d'autres ressources pour une promotion efficace.
  • Le site contient un grand nombre de pages qui ne sont pas reliées entre elles par des liens de navigation.
  • Le site contient des données multimédias qui ne sont pas indexées par le bot.
  • Le contenu des pages du site est constamment mis à jour.

Plan du site pour Google.News

Vérifier la validité du plan du site

Le moyen le plus simple de vérifier la validité du fichier de plan du site est de l'ajouter aux webmasters des moteurs de recherche et, s'il y a des problèmes ou des erreurs, vous les verrez dans le panneau.

Salutations, chers amis, sur les pages du site ! Aujourd'hui, je vais montrer comment ajouter Sitemap.xml à Google et Yandex. Je vous rappelle qu'un fichier Sitemap est un plan de site au format XML destiné aux moteurs de recherche, qui n'est pas visible par les visiteurs du blog. Il contient une liste de pages du site qui doivent être indexées par les robots de recherche, des informations sur leur importance et leur fréquence de mise à jour. La création d'un tel plan de site contribue à améliorer l'optimisation du référencement sur la page du site.

Comment ajouter un plan du site Sitemap.xml dans les panneaux des webmasters Yandex et Google

Pour ajouter un fichier Sitemap à Google et Yandex, vous devez d'abord le créer. Ensuite, nous ajoutons le site aux panneaux des webmasters Yandex et Google et confirmons les droits sur le site. Si vous ne l'avez pas encore fait, j'ai écrit plus tôt, et.

Passons maintenant à l'ajout du plan du site aux moteurs de recherche. Il existe deux manières d'informer les moteurs de recherche de la présence d'un plan Sitemap :

  • Ajoutez une directive Sitemap au fichier robots.txt. En savoir plus à ce sujet dans l'article « ».
  • Ajoutez des fichiers Sitemap aux moteurs de recherche dans Yandex.Webmaster et Google Webmaster Tools.

Même si vous avez déjà précisé les chemins d'accès au plan du site dans robots.txt, effectuer la deuxième méthode ne sera pas superflu.

Nous accédons au panneau Yandex.Webmaster en utilisant le lien http://webmaster.yandex.ua/, après nous être préalablement connectés. Dans la liste des sites ajoutés, sélectionnez celui dont nous souhaitons ajouter le fichier Sitemap à Yandex. Dans le menu de gauche « informations générales"sélectionner l'élément" Mise en place de l'indexation» – « Fichiers de plan du site ». Sur la page qui s'ouvre, entrez le chemin complet vers le plan du site dans un champ spécial et cliquez sur le bouton « Ajouter ».

Le plan du site XML a désormais été ajouté au moteur de recherche Yandex et le fichier Sitemap sera traité pendant environ deux semaines.

Si tout est fait correctement, après un certain temps, vous verrez l'image suivante :

Comme vous pouvez le voir, j'ai ajouté deux fichiers à Yandex : Sitemap.xml et Sitemap.xml.gz. Le second est un fichier XML compressé généré par le plugin WordPress Google XML Sitemaps. Je pense qu'il n'est pas nécessaire d'ajouter un fichier Sitemap compressé à Yandex, car lorsque vous cliquez sur l'un des boutons « Plus de détails », vous pouvez voir exactement les mêmes informations.

J'ai laissé les deux fichiers Sitemap ajoutés, car le blog est indexé sans problème et je ne vois aucune raison de changer quoi que ce soit.

Si vous devez supprimer le plan du site, cliquez sur la croix à côté du nom du fichier (voir la figure précédente).

Comment ajouter un plan de site à Google

Ici, nous faisons tout de la même manière. Connectez-vous à Google et accédez aux outils pour les webmasters en utilisant le lien https://www.google.com/webmasters/tools/. Sélectionnez le site souhaité dans la liste et sélectionnez l'élément « Configuration du site» – « Fichiers de plan du site ». Appuyez sur le bouton « Ajouter/Vérifier le fichier de plan du site“.

Une fenêtre pop-up apparaîtra dans laquelle nous entrons l'adresse du plan du site et cliquons sur " Soumettre le plan du site« . Attention, l'adresse http://site/ est déjà renseignée automatiquement et il vous suffit d'ajouter la partie manquante.

Comme nous le voyons, ajouter Sitemap.xml à Google et vous pouvez obtenir des informations à ce sujet plus rapidement que dans Yandex.

De la même manière, si nécessaire, le fichier Sitemap est vérifié dans Google. Il ne vous reste plus qu'à appuyer sur le bouton " Vérifier le plan du site» dans la fenêtre contextuelle.

Si vous rencontrez des erreurs lors de l'ajout de fichiers XML à Google, supprimez les fichiers de la liste (voir l'image ci-dessus) et essayez de les télécharger à nouveau.

Ajoutez Sitemap.xml à Yandex et Google vous en avez besoin une fois. Désormais, lorsque de nouveaux articles apparaissent sur un blog, les moteurs de recherche ne les manqueront certainement pas lors de l'indexation et le processus lui-même se déroulera plus rapidement. Le plan du site est automatiquement mis à jour dans les panneaux des webmasters Yandex et Google. Par conséquent, il n’est pas nécessaire d’ajouter un nouveau fichier Sitemap à chaque fois.

Comme vous pouvez le constater, rien de compliqué. Cependant, de nombreuses personnes oublient tout simplement d’ajouter le plan du site XML aux moteurs de recherche. Rappelez-leur en envoyant des liens vers cet article sur les réseaux sociaux (boutons ci-dessous).



Des questions ?

Signaler une faute de frappe

Texte qui sera envoyé à nos rédacteurs :