Vous avez investi dans un certificat SSL mais vous réalisez que c’est toujours la version http qui se classe dans les SERP de Google ? Cette débâcle a sûrement une cause, peu visible mais bien réelle : le monstre du duplicate content.
En quelques étapes, apprenez à l’identifier et à l’anéantir !
Le contenu en double qui se situe sous différentes URL ou différents domaines est appelé, d’après l’expression anglaise, duplicate content. Le duplicate content complique la vie des moteurs de recherche qui souhaitent toujours obtenir les résultats les plus pertinents pour l’utilisateur, car ils doivent choisir entre différentes versions.
Chaque webmaster doit avoir pour but de produire du contenu unique. C’est la première façon de réduire au minimum le duplicate content.
Les causes les plus fréquentes du duplicate content sont :
En particulier pour les gestionnaires de boutiques en ligne, il est souvent inévitable d’afficher du contenu en double. C’est le cas si un produit est répertorié avec la même description sous plusieurs catégories ou disponible en différentes couleurs. Un exemple parfait se trouve dans la boutique en ligne New Look.
Illustration 1 : Chaussures sur New Look
La page de détails du produit de l’illustration 1 affiche une paire de chaussures que nous pouvons trouver sous la catégorie "Sandales à talon" (URL 1).
http://www.newlook.com/fr/femme/chaussures/chaussures/sandales/sandales-noires-à-talons-block-et-brides-de-cheville-en-suédine/p/393286101
mais elle peut aussi se trouver sous la catégorie "Chaussures femme" (URL 2).
http://www.newlook.com/fr/chaussures/femme/sandales/sandales-noires-à-talons-block-et-brides-de-cheville-en-suédine/p/393286101
La balise canonique est un élément meta de la section <head> d’une page web grâce à laquelle on peut déterminer l’URL d’origine. Les moteurs de recherche indexent donc uniquement l’URL "canonique" et ignorent la copie. Si vous voulez éviter qu’un site avec un contenu en double ne soit indexé, ajoutez cette balise et indiquez le lien de l’URL originale.
Dans le code source, Newlook fait tout juste. Sur les deux URL, la première URL est référencée comme l’originale à l’aide de la balise canonique : le moteur de recherche sait donc quelle URL il doit indexer.
Illustration 2 : Extrait du code source
Le duplicate content cache donc un potentiel précieux. Il est important non seulement de réduire le nombre de doublons, mais aussi de créer les conditions techniques nécessaires. La balise canonique est une solution rapide pour faire barrage au duplicate content. Elle doit être utilisée de manière sélective, mais en aucun cas pour régler des problèmes de duplicate content sur des grosses surfaces. Les moteurs de recherche doivent tout de même analyser les URL pour apercevoir la balise canonique. Ce processus peut, dans le cas de grands sites web avec de nombreuses pages, gâcher les ressources du robot d’exploration.
C’est pourquoi le duplicate content ne devrait jamais apparaître en première place. Google lui-même recommande d’éviter les contenus qui peuvent être consultables sous plusieurs URL dans la même structure du site. On évite ainsi la création de duplicate content et on protège le budget d’exploration.
À l’aide de Ryte, le duplicate content peut être détecté en seulement quelques étapes. Dans le module Website Success, dirigez-vous sur le rapport "Contenu" -> "Contenu dupliqué" -> "Duplicatas". Le rapport vous montre sous forme de liste tous les contenus en double du site web trouvés par le robot d’exploration, ainsi que le nombre d’URL qui sont touchées. En cliquant sur la loupe de la colonne "Contenus dupliqués (nombre)", toutes les URL seront affichées.
Illustration 3 : Rapport sur le duplicate content
Les couleurs indiquent les différents niveaux d’optimisation. Le rouge signifie qu’il y a encore beaucoup de place pour une amélioration. Les barres jaunes correspondent aux URL pour lesquelles il n’est pas urgent de procéder à une optimisation, tandis que la barre verte assure que tout est en ordre. Chaque barre est accompagnée du nombre de doublons.
Cliquez sur la loupe pour obtenir des informations sur tous les doublons en rapport avec la page en question.
Illustration 4 : Optimiser les contenus dupliqués
Pour cette URL originale, on peut voir qu’il existe quatre doublons : il faut optimiser !
Le duplicate content n’est certes pas une raison pour Google pour rayer un site web de son index, mais c’est surtout le potentiel du site qui est gâché. Les conseils ci-dessus vous permettent d’éviter le duplicate content et de développer ce potentiel au maximum.
Vous êtes prêts à affronter d’autres monstres de l’optimisation ? Le prochain article présentera le neveu plutôt teigneux de notre monstre du duplicate content : le monstre de la balise canonique. Nous vous montrerons comment vous en débarrasser en deux trois mouvements !
Détectez et corrigez vos contenus dupliqués avec Ryte FREE
Écrit le 23.05.2017 par Eva Wagner.
Eva rassemble beaucoup d'expérience dans le marketing. En 2015, elle devient un super-héros à Ryte. Avec beaucoup de créativité et un sens affiné pour les sujets d'actualité, elle gérait les activités de rédaction de Ryte. Elle organisait aussi la participation de l'entreprise à de grands événements et salons, comme la dmexco de Cologne.
Suivi, analyse et optimisation de vos actifs numériques grâce à notre technologie unique
S’inscrire gratuitement