Le duplicate content est un problème auquel chaque webmaster doit faire face un jour.
Initialement, le duplicate content n'est pas un signal négatif pour Google et les autres moteurs de recherche. Cependant, un contenu identique et similaire présent sur différentes URL peut causer une certaine confusion et par conséquent des complications dans les rankings. Et si on traitait enfin ce problème à l’aide de techniques SEO un brin habiles ?
Dans un tout premier temps, êtes-vous concerné ? Commencez par identifier si votre site web se compose de certains éléments dupliqués à l’aide du module Website Success du logiciel Ryte.
Illustration 1 : Aperçu du rapport sur le duplicate content.
Afin de contrer le duplicate content, les options suivantes sont disponibles : l'utilisation d'un canonical tag et d'un redirect 301. Les deux méthodes peuvent être très efficaces lorsqu'elles sont utilisées de manière appropriée. Cet article vise à montrer quelle est la meilleure solution selon les cas d’application.
En règle générale, il est facile de définir des mesures claires pour l'optimisation On-Page d'une page. Il existe des recommandations connues concernant les meta titles ou les descriptions, ainsi que des règles explicites sur la structure des titres pour qu’ils conviennent au mieux aux utilisateurs et aux moteurs de recherche. Parallèlement, un mot-clé unique peut influencer de manière significative les positions dans les SERP.
Cependant, quand il s'agit de faire la distinction entre la nécessité d'un canonical tag ou d’un redirect, de nombreux webmasters et professionnels du SEO sont en désaccord. Sur base de cette ambiguïté, il existe un risque que l'une ou l'autre possibilité ne soit pas correctement intégrée. En fin de compte, cela peut conduire à des résultats indésirables et inverses à l'optimisation planifiée. On peut certes éviter le duplicate content, mais les sections importantes d'un site Web pourraient ne plus être indexées ou explorées.
C’est pourquoi il est important de clarifier la fonctionnalité des redirections et des canoniques.
Un canonical tag, balise canonique ou tag canonique est utilisé pour indiquer aux moteurs de recherche quelle version d'une page web doit être indexée. Pour deux pages identiques mais aux URL différentes, la deuxième se réfère à la première via un canonical tag. Cela montre ainsi à Google et aux autres moteurs de recherche quelle version doit être indexée.
La page de référence continuera d'être explorée. La balise canonique est intégrée directement dans la section <head> du site web. Il n'est pas nécessaire de modifier le serveur. Dès qu'un robot d’exploration visite la page Web, il lit la balise et indexe la page Web dite canonique. Une balise canonique peut également faire référence à la même page pour empêcher le plagiat sur les sites Web.
www.mapage.fr/a et www.mapage.fr/b existent avec un contenu similaire, mais sous des URL différentes. Le canonical tag suivant se verra intégré sur la page /b sous la forme suivante :
<link rel=“canonical“ href=“http://www.mapage.fr/a“/>
La balise canonique est donc utilisée chaque fois que le contenu est utilisé plus d'une fois ou lorsqu'il est techniquement impossible d’employer une URL unique. Ce peut être par exemple si la page d'accueil peut être atteinte via différentes URL (www.domaine.fr, domaine.fr, www.domaine.fr/index.html, etc.), quand les pages peuvent être ouvertes avec ou sans slash de fin (“/”) ou si le contenu est présenté sous des aperçus différents (version imprimée, PDF, etc.).
Fondamentalement, il serait logique d’inclure une balise canonique sur chaque page, de sorte que chaque page pointe vers elle-même. L’intérêt serait de corriger ou d’anticiper les erreurs et liens incorrects.
Une redirection ou redirect 301 est un transfert permanent d'une page vers une autre URL. Les utilisateurs ne remarquent généralement pas cette redirection. Chaque redirection 301 hérite de près de 100 % de la force du lien.
On fixe une redirection en adaptant le fichier .htaccess, qui est est stocké sur le serveur. Tout d'abord, un navigateur ou un crawler envoie une requête URL au serveur. Ce dernier compare la requête avec le fichier .htaccess et redirigera l'URL vers une autre URL si une entrée correspondante existe.
Un redirect 301 peut être utilisé de différentes manières, mais on le met généralement en place lorsque les URL changent et que l'utilisabilité n'est pas affectée par des pages d'erreur. Parallèlement, la redirection 301 permet également d'éviter le duplicate content.
Voici à quoi peut ressembler une entrée dans le fichier .htaccess si la page http://mapage.fr doit être redirigée en permanence vers l’URL http://www.mapage.fr.
Afin de rendre l’utilisation de la balise canonique et de la redirection 301 plus facile à comprendre, nous vous présentons ici plusieurs scénarios d’application.
N’importe quel gestionnaire d’une boutique en ligne ou un autre site de e-commerce connaît le problème. Beaucoup de produits se ressemblent au niveau de la couleur ou du numéro de modèle et disposent pratiquement des mêmes descriptions de produits. Les différentes variantes de produit sont en revanche toutes indexées sous différentes URL.
En précisant les spécifications du produit directement dans l'URL, il est plus facile de comprendre ce que l'utilisateur attend lorsqu’il clique sur le lien. Cependant, plusieurs URL pour des produits similaires signifient généralement du contenu en double pour les moteurs de recherche.
La solution : il est important qu'une seule URL soit indexée par Google afin d’éviter les doublons. La façon la plus simple est d'utiliser la balise canonique. Elle indique à Google quelle URL il faut indexer.
Exemple : il existe deux pages pour des produits similaires.
maboutique.fr/chaussure1-jaune et maboutique.fr/chaussure1-rouge
Si Google veut seulement indexer une URL et définir /chaussure1-jaune comme originale, le canonical tag suivant doit être inséré dans la section <head> de la page /chaussure1-rouge :
<link rel=“canonical“ href=“http://maboutique.fr/chaussure1-jaune“>
Le rapport sur l’indexabilité du module Website Success de Ryte met à votre disposition un aperçu de vos valeurs canoniques. Vous identifiez tout de suite si elles ont été bien intégrées ou pas.
Illustration 2 : Aperçu des canonical tags dans le module Website Success de Ryte (Indexabilité > Canoniques > Codes de statut)
Important : dans la mesure du possible, utilisez des URL absolues dans la balise canonique.
Vous tenez un blog et vous avez écrit un article qui est en cours de mise à jour. Non seulement le contenu change, mais l'URL aussi. Afin de ne pas perdre le trafic existant de l'ancien article, il est préférable de rediriger l'ancienne URL vers la nouvelle. Il est aussi intéressant de savoir que la force du lien sera presque entièrement transmise. C’est un aspect important si l'ancien article a déjà été cité et lié depuis d'autres sites Web.
La solution : avec un redirect 301, l'ancienne URL peut être redirigée en toute sécurité et sans inconvénient vers la nouvelle URL. Il est aussi recommandé d'obtenir de nouveaux liens pour la nouvelle URL, afin que les moteurs de recherche remplacent la nouvelle URL par l'ancienne dès que possible.
Le même rapport sur l’indexabilité de Ryte vous présente un aperçu des codes de statut de vos redirections. Dans le module Website Success, cliquez sur Redirections > Codes de statut et identifiez si des redirects 301 ne fonctionnent pas comme voulu.
Illustration 3 : Rapport sur les codes de statut des redirects 301
De nombreux sites passent à la version chiffrée HTTPS, et ils ont bien raison de le faire. D'une part, cela augmente la sécurité pour les utilisateurs, d'autre part, les webmasters obtiennent un possible avantage de classement. Ce changement peut toutefois créer du contenu dupliqué, car Google indexe à la fois la version HTTPS et l’ancienne version HTTP.
Pour éviter ce problème, la redirection 301 peut être utilisée. La version HTTP est redirigée page par page vers la version HTTPS du site. Inconvénient : sur de gros sites web, le temps de chargement peut se voir nettement allongé par les redirections permanentes.
Solution pour les petits sites web : toutes les pages sont redirigées vers la version HTTPS par un redirect 301.
Solution pour les très grands sites web : le rel=canonical réfère la version HTTPS comme URL d'origine. Les robots d’exploration sont donc obligés d'indexer la version chiffrée. Le rapport sur les canoniques de Ryte dresse une liste de toutes les cibles canoniques, ce qui peut être utile lorsqu’on travaille sur de gros projets.
Illustration 4 : Liste de toutes les cibles canoniques (Indexabilité > Canoniques > Page de destination)
La gamme de produit dans une boutique en ligne est toujours sujette à des changements. Un produit peut être épuisé, un article peut être retiré de la vente. Si l'URL est simplement supprimée lorsqu'un produit n'est plus disponible, l'utilisateur rencontre un obstacle : une page d'erreur est affichée car le serveur ne trouve plus l'URL demandée.
La solution : afin de ne pas affaiblir l'expérience utilisateur, une redirection 301 vers une nouvelle URL est recommandée. Il peut s'agir d'un transfert vers une catégorie supérieure, vers une version plus récente ou vers une page d’un produit similaire.
Si, en revanche, on est sûr que le produit n'est que temporairement épuisé, il est également possible d'utiliser une redirection 302. Cette dernière indique que la redirection est de nature temporaire et sera prochainement annulée.
Conseil : si c’est votre intention d’afficher une page d’erreur, optimisez-la ! Si un utilisateur accède à cette page, il recevra non seulement un message d'erreur, mais aussi une indication sur les produits qu'il peut trouver à la place. Il est également possible d'intégrer la fonction de recherche sur la page d'erreur 404. Cet article aborde le sujet en profondeur.
Illustration 5 : Fonction de recherche sur une page d’erreur 404 sur le site de Marc O’Polo.
Si votre site se trouve en haut du classement des SERP avant sa relance, c’est évident que vous aimeriez que ça reste le cas. Cependant, ce n'est pas une certitude si vous ne le faites pas en toute connaissance de cause. Si la nouvelle page est simplement lancée sans aucune préparation, les anciennes URL ne seront plus accessibles. Le moteur de recherche indexe l'URL exacte d’un site Web et lorsque la structure du site Web est modifiée, pratiquement aucune page ne conservera son URL.
La solution pour la relocalisation de domaine : avec un redirect 301, l'ancienne URL du domaine peut être transférée vers la nouvelle URL. Les utilisateurs sont ainsi directement guidés vers la nouvelle URL sans voir une page d'erreur ou recevoir un message du navigateur indiquant que la page entière n'est pas disponible. Dans ce cas, il est important que toutes les pages Web soient correctement transférées.
Pour cette raison, toutes les "anciennes" URL du site web doivent être enregistrées avant de pouvoir être affectées sur le nouveau domaine. Il est également important que ces transferts soient surveillés en permanence après la relocalisation. Si nécessaire, les webmasters peuvent réagir rapidement et minimiser les pertes de classement.
La balise canonique et la redirection permanente 301 sont des outils puissants qui doivent non seulement être utilisés pour éviter les doublons, mais aussi pour améliorer l'expérience utilisateur. Tout professionnel sachant déterminer quelle méthode est la mieux adaptée à quelle situation assurera la satisfaction de ses utilisateurs ainsi que des résultats positifs et encourageants dans les moteurs de recherche.
On essaie ? Ryte FREE vous aide à monitorer vos redirects et canonicals
Écrit le 03.01.2018 par Pauline Mitifiot.
Après des études d’histoire et de gestion de projet qui lui permirent de découvrir la Turquie, l’Italie et l’Allemagne, Pauline posa ses valises à Munich car elle ne pouvait plus se passer de son bretzel quotidien. Curieuse et dynamique, elle contribue à la section française du blog et du Wiki de Ryte.
Suivi, analyse et optimisation de vos actifs numériques grâce à notre technologie unique
S’inscrire gratuitement