Un plan de site XML est une liste au format XML qui répertorie l’ensemble des sous-pages d’un site web. Un sitemap XML structure un site web de la même manière qu’une table des matières structure un article.
Il permet notamment aux robots d’indexation de s’orienter plus rapidement, renvoie aux sous‑pages adéquates à l’aide de liens et distingue les éléments de texte des autres contenus tels que les images, les vidéos, ou les podcasts. À l’aide des metadonnées, le Googlebot reçoit des informations concernant la fréquence de téléchargement de nouveaux contenus sur le site ainsi que la date de dernière modification.
Les plans de site XML sont structurés de manière hiérarchique de sorte que chaque page est liée à toutes les autres. Ils nécessitent l’utilisation d’un format lisible par les moteurs de recherche afin de pouvoir être explorés par ces derniers : il s’agit du protocole de sitemap XML. Ils peuvent également être consignés sous forme de flux RSS ou de document texte.
<?xml version=”1.0" encoding="UTF-8"?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Illustration 1 : exemple de construction d'un sitemap XML
La principale différence réside dans le fait que le plan de site XML est "invisible" pour le lecteur puisqu’il est intégré à la structure de votre site sous forme de fichier caché. Le plan de site XML est élaboré à l’intention de Google et des autres moteurs de recherche, qui peuvent explorer plus facilement les sites web munis de fichiers XML. Cet élément peut également se révéler très intéressant pour vos mesures de référencement étant donné que le plan du site indique à Google de manière structurée quels sont les éléments nouveaux de votre présence en ligne.
Illustration 2 : structure du sitemap XML dans Google (www.google.com/sitemap.xml)
À l’inverse, le plan de site HTML est visible par l’internaute dans le navigateur, généralement dans la partie inférieure de la page. Il n’est en aucun cas obligatoire et n’a de sens que lorsque le site propose tellement de contenu que la barre de navigation principale ne peut pas afficher clairement l’ensemble des thèmes. Il se révèle très pratique pour les visiteurs, étant donné que ces derniers peuvent ainsi trouver plus facilement ce qu’ils cherchent. Le plan de site HTML permet donc une meilleure orientation.
Ce genre de "table des matières" peut par exemple se révéler intéressant pour les entreprises, les bloggeurs ou les exploitants de magazines en ligne qui souhaitent proposer une valeur ajoutée supplémentaire à leurs lecteurs. Ils intègrent alors une barre contenant des informations sur l’entreprise, les offres de services ou les partenaires sur la page d’accueil ainsi que sur chacune des sous-pages du site. Les bloggeurs peuvent utiliser leurs archives comme plan de site. Ainsi, les visiteurs peuvent choisir de consulter le contenu de leur blog de manière thématique ou chronologique.
Illustration 3 :plan de site HTML de Asos
Il existe plusieurs possibilités pour élaborer votre plan de site XML. Vous pouvez soit le créer manuellement, soit utiliser des outils – pour ce faire, Google vous propose une liste de prestataires. La création à l’aide d’un outil est simple : il vous suffit d’entrer votre URL et de télécharger le fichier terminé. Habituellement, le fichier est intitulé "sitemap.xml", mais il vous est possible de le renommer.
Si d’autres documents portant les extensions .gz, .html ou .txt ont été générés au cours de l’élaboration du plan du site, vous pouvez tout simplement les ignorer. Attention : les choses peuvent maintenant devenir délicates si vous ne connaissez pas bien la structure des répertoires de votre site. En effet, vous devez télécharger le plan du site XML au bon emplacement : dans le répertoire racine ou dans le répertoire principal de votre site web. Veillez à ce qu’il n’atterrisse pas dans un sous-répertoire, mais à l’extérieur des dossiers tels que metadata, wp-admin, wp-content et wp‑includes.
Illustration 4 : exemple d'une structure de répertoire
Lorsque le fichier est consultable sous l’URL suivante, vous pouvez le soumettre à Google :
http://www.domaineexemple.fr/sitemap.xml
Vous pouvez également intégrer la ligne suivante à un emplacement arbitraire de votre fichier robots.txt :
Sitemap : http://domaineexemple.fr/sitemap_location.xml.
Connectez-vous ensuite à Google Search Console et sélectionnez le domaine correspondant.
Illustration 5 : choisir une propriété dans Google Search Console
Dans la barre de navigation, cliquez sur "Exploration" puis sur "Plan du site". Un clic sur l’onglet "Ajouter un plan du site" permet d’afficher votre URL et un champ vide dans lequel vous pouvez saisir le nom du fichier.
Illustration 6 : ajouter un sitemap dans Google Search Console
Ainsi, vous avez ajouté à votre site une sous-page uniquement visible en saisissant la totalité de son URL.
Conseil : si la taille de votre plan de site non comprimé est supérieure à 10 MB, divisez-le en plusieurs petits plans de site et ajoutez un fichier d’indexation des plans de site.
Il est évident que vous devez publier sur votre site de nouveaux contenus aussi souvent que possible afin de constituer une "clientèle de base", d’acquérir des lecteurs fidèles et d’attirer de nouveaux adeptes. Il est tout aussi évident que les robots d’indexation examinent régulièrement le Web à la recherche d’informations actualisées. Pourquoi Google a-t-il besoin des mises à jour des plans de site malgré ses algorithmes si performants ?
C’est très simple : en tant qu’early bird, vous disposez d’un avantage concurrentiel. Les nouveaux contenus sont indexés et trouvés plus facilement. De cette manière, les magazines en ligne augmentent leurs chances de proposer un reportage exclusif et se procurent idéalement l’une des Box Google tant convoitées. Tous les types de plans de site utilisés, notamment les plans de site textes, images ou vidéos, doivent donc être mis à jour à chaque modification du contenu du site.
Attention : des actualisations trop régulières ont des conséquences néfastes sur la vitesse de chargement du site.Il existe des versions étendues du plan du site destinées aux autres types de media. Les plus importantes sont les plans de site images, vidéos et actualités. Dans le cas d’un site comportant uniquement des contenus textuels, vous pouvez vous limiter à un plan de site XML ou HTML. Cependant, si vous utilisez régulièrement des images, si vous proposez des vidéos de tutoriels à vos lecteurs ou si vous souhaitez apparaître dans Google Actualités, il est conseillé d’élaborer les "tables des matières" adéquates. Google lui-même semble enthousiaste face aux nouvelles possibilités permettant de présenter de meilleurs résultats de recherche – avec l’aide de l’exploitant du site.
Cela est particulièrement vrai dans le cas des plans de site XML vidéo :
(Déclaration Google Search Console au sujet des plans de site XML vidéo)
Un plan de site XML images associe des contenus images à des attributs supplémentaires, comme par exemple toutes les informations concernant l’image en question (image:image). En pratique, pour la visibilité et le classement dans Google Images, il est possible d’attribuer des lieux aux images (geo_location). Les internautes arrivent ainsi directement sur votre site web via les images.
Pour les vidéos, il existe le plan de site XML vidéo du même nom. Les moteurs de recherche peuvent ainsi mieux délimiter les vidéos par thème et les proposer aux bons groupes-cibles. Vous bénéficiez d’un avantage non négligeable pour la recherche de vidéos Google lorsque vous ajoutez des rich snippets à l’aide d’une balise individuelle du site schema.org. Dans les balises, vous pouvez indiquer tout type d’informations, du créateur, titre et contenu de la vidéo au lieu de tournage et à la durée, en passant par une mention indiquant si ce contenu est adapté à un usage en famille.
Illustration 7 : exemple d'un sitemap vidéo XML (source)
La création d’un plan de site XML actualités séparé est particulièrement intéressante pour les journaux en ligne et les blogs d’entreprise. En effet, afin d’évaluer la pertinence de votre contenu et la confiance qu’il peut accorder à vos auteurs, le Googlebot requiert des balises spécifiques aux actualités. Les plus importantes d’entre elles sont le nom du media utilisé (publication), le titre de l’article (title), ainsi que la date de publication (publication_date). Ces informations peuvent avoir un impact positif sur le classement de votre site.
Dans le menu "Exploration Web" du Search Console, vous trouverez le "Rapport de plan du site", un outil de Google extrêmement pratique étant donné qu’il vous permet de vérifier si votre site contient des erreurs qui gênent les robots lors de l’indexation. La plupart du temps, ces problèmes se trouvent dans le code de statut lorsque les extensions d’URL ont été renommées et que les redirections 301 n’ont pas été mises en place. Le rapport d’erreur du plan du site indique donc pourquoi l’accès au site était impossible.
Illustration 8 : vérifier le sitemap dans Google Search Console
Les codes de statut 404 (liens morts ou brisés) constituent un problème courant : lorsqu’un visiteur tente de consulter votre site, un message "Page introuvable" et dans le pire des cas, le petit symbole d’un homme de chantier qui y est associé s’affiche. Vous trouverez une liste des pages introuvables et des autres problèmes d’indexation dans la rubrique "Erreurs d’exploration".
Avec le module Website Success de Ryte, vous pouvez également vérifier quelles pages de votre site figurent dans le fichier Sitemap.xml ou s’il existe des problèmes avec celui-ci. Pour utiliser cette fonctionnalité, vous devez saisir l’URL de votre plan de site dans l’outil et activer la fonctionnalité correspondante. Dans l'élément du menu "Sitemaps", "Pages inclues dans le sitemap", vous obtenez un aperçu exact de toutes les pages consignées dans votre fichier sitemap.xml.
Illustration 9 : contrôler le sitemap avec Ryte Website Success
Les plans de site ne garantissent en aucun cas que les contenus de votre site web seront explorés et indexés, étant donné que les processus des algorithmes sont prédéterminés. Cependant, la transmission d’un plan de site articulé de manière logique peut permettre de faciliter l’indexation aux robots des moteurs de recherche. L’ajout d’un plan de site XML vidéo est particulièrement recommandé en cas d’intégration de vidéos, qui deviennent de plus en plus importantes dans le cadre de l’optimisation pour les moteurs de recherche.
En mettant à disposition de Google des informations exhaustives concernant leur offre en ligne, les webmasters peuvent influencer l’exploration de leur site. Il est donc recommandé de se pencher sur l’optimisation technique du référencement naturel pour augmenter ses chances de classement. Un plan de site XML n’est en aucun cas obligatoire, mais il ne fait pas de mal et sa conception nécessite un investissement extrêmement réduit.
Contrôlez et surveillez votre sitemap XML avec Ryte FREE
Écrit le 10.05.2017 par Eva Wagner.
Eva rassemble beaucoup d'expérience dans le marketing. En 2015, elle devient un super-héros à Ryte. Avec beaucoup de créativité et un sens affiné pour les sujets d'actualité, elle gérait les activités de rédaction de Ryte. Elle organisait aussi la participation de l'entreprise à de grands événements et salons, comme la dmexco de Cologne.
Suivi, analyse et optimisation de vos actifs numériques grâce à notre technologie unique
S’inscrire gratuitement