Sitemap XML

Un sitemap XML est une liste d'URL créée au format XML qui contient toutes les sous-pages d'un site Web. Le plan du site XML peut être téléchargé dans Google Search Console ou dans les Webmaster Tools de Bing pour permettre de soumettre toutes les URL d'un site Web aux moteurs de recherche. Le sitemap peut prendre en charge l'indexation des sous-pages. Cependant, il n' y a aucune garantie que les URL transmises seront incluses dans l'index. Dans la pratique, le sitemap XML est souvent appelé "Google Sitemap".

Contexte

Aujourd’hui, il est de manière générale très facile pour chaque webmaster d’indexer son site web dans les moteurs de recherche. La plupart du temps, il suffit juste de mettre en ligne son projet et d’y attribuer un lien. Au début des années 2000, chaque opérateur de site web devait encore inscrire chaque page dans les moteurs de recherche, afin que le projet web soit répertorié par le crawler, et de ce fait indexé.

Afin d’alléger l'indexation, les fournisseurs de moteurs de recherche comme Bing et Google offrirent la possibilité aux webmasters de télécharger une sorte de liste de toutes les pages secondaires inhérentes à leurs sites web. Le format proposé est le langage de balisage XML : c’est aujourd’hui toujours ce format qui est utilisé. Sous ce format enregistré, les webmasters peuvent déposer sur les outils Webmasters des fournisseurs de moteurs de recherche une vue d’ensemble de toutes leurs pages.

600x400-XMLSitemap FR.png

Mise en place et montage d’un sitemap XML

Un sitemap XML doit remplir un certain nombre de conditions pour être accepté par les moteurs de recherche, ou du moins pour qu’il puisse être lu. La langage de balisage le plus courant est le protocole du sitemap Google 0.9, comme défini sur sitemap.org. À la base, un sitemap rassemble toutes les URLs d’un site web, qui sont des instructions pour les codes de caractère, ainsi que des metadonnées supplémentaires, par exemple relative à la priorité d’une page, à sa date d’actualisation ou à sa fréquence. Un sitemap XML peut aussi être ajouté de manière séparée pour les données à caractère spécial.

Avant qu’un sitemap soit édité, il faut que les données remplissent les conditions de chaque fournisseur de moteur de recherche. Par exemple, Google autorise seulement les plans sitemap qui possèdent au maximum 50 000 URLs et qui sont volumieux de 50 Megabyte. Si les données sont plus grosses, le sitemap doit être divisé.

Création

Chaque système de gestion de contenu (CMS) de online shops peuvent créer automatiquement des plans sitemap et les télécharger sur leur propre serveur. Les instructions relatives à la fréquence ou à l’actualisation sont ensuite gérées par le webmaster. Il existe sur le web de nombreux outils qui peuvent proposer une alternative aux services d’un webmaster et qui peuvent aussi aider à la création un sitemap.

La création exemplaire d’un sitemap :

<?xml version="1.0" encoding="UTF-8"?>
 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>http://www.example.com/</loc>
      <lastmod>2005-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
 </urlset>

Le téléchargement

Pour télécharger son sitemap XML sur Google, il faut utiliser son compte Google et faire ensuite vérifier sa page par le Google Webmaster Tools. Une fois que cela a été réalisé, on peut télécharger manuellement son sitemap. La méthode la plus pratique consiste à actualiser son sitemap à intervalles réguliers et de déposer ses données sur le serveur, comme par exemple sur .

www.monsiteweb.fr/sitemap.xml

Cette URL peut être aussi enregistrée dans Search Console, afin que le sitemap soit récupéré depuis cette plateforme. Si des erreurs au sein du sitemap surviennent, l’utilisateur du Webmaster Tools de Google ou de Bing en sera immédiatement informé. Il est conseillé de traiter ces erreurs le plus vite possible, afin de faciliter l'exploration des sous-pages et l'indexation. Sinon, il est aussi possible d’insérer un fichier robots.txt pour les URL en question.

Avantages du sitemap

Le téléchargement d’un sitemap offre plusieurs avantages. Tout d’abord, cela facilite l’indexation du contenu dynamique par les moteurs de recherche. Ensuite, il aide les crawlers à retrouver plus vite des données supplémentaires plus lourdes, tels que les images. De même que sur une page d’accueil d’un gros site web qui ne possède encore aucune structure de liens retour, un sitemap assure que toutes les subpages puissent être retrouvées. Pour les webmasters qui exploitent une page possédant un gros répertoire d’archive mais qui est peu liée, le sitemap présente de nouveau l’avantage de faciliter le crawling pour ce contenu.

Particularités

Un sitemap ne rassemble pas seulement les URLs de toutes les page secondaires d’un site web, mais il peut être aussi utilisé pour les données spéciales et pour l’utilisation même du site web. Les nouvelles pages peuvent par exemple être intégrées au sein d’un nouveau sitemap. Les pages relatives à l’actualité peuvent utiliser un sitemap correspondant. Les plans sitemap peuvent aussi aider à l’organisation des photos et des vidéos directement au sein des Webmaster Tools. Un sitemap vidéo possède des instructions sur le temps de jeu ou le contenu, tandis qu’un sitemap image concentrera des informations supplémentaires sur le type d’image ou les autorisations. En outre, les webmasters peuvent aussi télécharger un sitemap spécialement conçu et optimisé pour une utilisation mobile, et ce pour toutes les pages de leur site web.

Sitemap XML et référencement

Lorsqu’on télécharge un sitemap XML, il ne faut pas penser que le positionnement au sein des SERPs pour un terme recherché en sera amélioré. Les changements sur les meta éléments, sur la priorité ou la fréquence d’actualisation, n’ont aucune influence sur le classement de chaque page secondaire. Toutefois, un sitemap soigné et construit de manière logique peut apporter certains avantages, comme aider à trouver la page voulue plus rapidement. De cette manière, les pages web qui sont initialement faiblement reliées voient leurs chances d’être crawlées augmentées, ainsi que d’améliorer leurs classements, dans la mesure qu’elles aient aussi été optimisées du point de vue des moteurs de recherche.

Sitemap vs. sitemap XML

Beaucoup de système de gestion de contenu fournissent dans le sommaire d’un site web un soit-disant “sitemap” au sein du frontend. Il s’agit en réalité d’une fonction essentielle dudit “Sitemap”. Il ne faut pas la confondre avec le sitemap XML. Au contraire du sitemap qui est un sommaire d’un site web, le sitemap XML n’est pas visible pour les utilisateurs et est seulement fourni à Google en tant que données. Quand un plug-in correspondant est employé ou que l’URL sous laquelle le sitemap XML d’un site web a été déposé est connue, le sitemap XML sera affiché. Le sitemap HTML est souvent utilisé pour renforcer les liens internes via une table des matières ou un sommaire.

Lien web

Aide à l’indexation : guide pratique du sitemap XML, Ryte Magazine

Catégorie