Pourquoi les pages d’erreurs 404 sont très importantes et comment les configurer ? C’est aujourd’hui tout le sujet de ce nouvel article.
Si vous surfez régulièrement sur le Web, vous avez très probablement déjà vu au moins une fois cette ligne bien connue en caractères gras : "Not Found. The requested URL /xyz.htm was not found on this server". Elle s'affiche généralement par défaut lorsqu'un serveur ne trouve pas une URL demandée par un client.
Les pages d'erreurs 404 s'affichent lorsqu'un serveur ne peut pas ouvrir l'URL demandée par un client, tout simplement parce que cette URL n'existe plus sur le serveur. L'erreur 404 est comparable par exemple à l'affiche "en rupture de stock" dans un magasin ou encore à l'ancienne adresse d'un ami d'école qui a depuis déménagé.
Il existe diverses raisons pour lesquelles le serveur ne trouve plus les URL. Par exemple, si l'un des événements suivants se produit :
Si aucune page d'erreur 404 n'est créée, le serveur ne peut pas fournir une réponse adéquate à une ressource non trouvée. Ce n'est pas bon dans deux mesures : les utilisateurs ne savent pas pourquoi l'URL demandée ne fonctionne pas et ont une expérience négative sur votre site. Le Googlebot veut accéder à une ressource inexistante mais n'obtient pas le code 404 ou 410 correct informant que cette URL n'est plus disponible. Dans les deux cas, un signal négatif est envoyé à Google. Il est donc d'autant plus important de configurer une page d'erreur 404.
Une autre possibilité est de rediriger l'URL vers la page d'accueil grâce à la redirection 301. Même si cette variante est actuellement choisie par de grandes marques comme Esprit ou Airbnb, elle conduit à moyen terme à des erreurs dites Soft 404. Nous reviendrons sur ce point dans la dernière partie de notre article.
Le Monde a choisi une sorte de solution intermédiaire mais habile. Lorsqu'une URL non disponible est demandée, la page Web mène non seulement les visiteurs vers la page d'accueil mais propose également deux autres options, explicitement signalées.
Illustration 1 : Redirection vers la page d'accueil sur lemonde.fr
Les pages d'erreur 404 n'ont en principe pas d'effet négatif sur le classement d'un site Web. Elles n'entraînent pas non plus de pénalités par Google. Ceci a été confirmé par Gary Illyes déjà en 2015 dans un Tweet :
Illustration 2 : Tweet de Gary Illyes, daté de 2015
Pour qu'une page d'erreur s'affiche, une simple entrée dans le fichier .htaccess suffit dans un premier temps. On y ajoute l'entrée suivante.
Traduite, cette ligne signifie : si l'on demande au serveur d'ouvrir une URL qui n'existe plus (ErrorDocument 404), la page suivante s'affiche. Évidemment, vous devriez d'abord créer une page correspondante dans votre domaine. En fonction du type de CMS que vous utilisez, de telles pages existent généralement déjà par défaut.
Dans la variante la plus simple, une page d'erreur 404 peut ressembler à ceci :
Illustration 3 : Version la plus simple d'une page 404
Il est donc clair qu'il n'est pas seulement nécessaire d'afficher des pages d'erreur 404, mais aussi de les mettre en forme comme il se doit. En effet, une telle page d'erreur aura pour conséquence que les visiteurs partent immédiatement pour soit retourner à la recherche sur Google, soit fermer complètement la fenêtre du navigateur . Ces deux types de réactions sont mauvaises pour votre site. Le mieux serait donc que vous preniez en compte les conseils suivants pour créer de bonnes pages d'erreur 404.
Qui aime se retrouver dans une impasse ou devant des rayons vides ? Si un visiteur atterrit sur une page d'erreur 404 sur votre site, vous devriez tout d'abord l'informer que la page demandée n'est pas disponible.
La variante la plus simple pour que l'utilisateur reste sur votre site est de le renvoyer à la page d'accueil.
Illustration 4 : Renvoi vers la page d'accueil ryte.com
Illustration 5 : Renvoi vers d'autres catégories depuis la page 404
Illustration 6 : Fonction de recherche sur la page 404
Illustration 7 : Possibilités d'interaction sur la page 404
D'ailleurs, Google ne montre guère d'imagination en ce qui concerne ses pages 404. Mais en tant que fournisseur du plus grand moteur de recherche au monde, il est facile d'imaginer quelle page les utilisateurs ouvriront ensuite...
Illustration 8 : Page d'erreur 404 de Google
Même si les erreurs 404 appartiennent aux propriétés « naturelles » d'une page Web, vous devriez vérifier régulièrement si votre page ne contient pas d'éventuels codes d'erreur. D'une part, vous pouvez ainsi vous assurer que toutes les URL importantes de votre site sont accessibles avec un navigateur. D'autre part, une accumulation flagrante d'erreurs 404 peut indiquer d'éventuels problèmes après un réaménagement ou une restructuration d'URL.
Si votre page est indexée dans l'outil Google Search Console, vous trouverez le rapport concernant les pages 404 défectueuses dans le menu "Erreurs d'exploration". Sélectionnez alors l'onglet "Ordinateur" puis cliquez sur "Introuvables". Toutes les erreurs 404 transmises par Google s'affichent alors.
Illustration 9 : Rapport sur les erreurs 404 dans Google Search Console
Lors de l'analyse de ces indicateurs, notez que les données sont produites entre autre par un recoupement des URL existantes dans le sitemap.xml. Des erreurs 404 ayant déjà été résolues ou dont les URL n'existent déjà plus dans l'index de recherche Google peuvent donc être affichées.
Souvent, ces erreurs 404 surgissent à nouveau dans la liste, bien que vous les ayez déjà marquées comme corrigées. Cela est dû aux multiples explorations des pages par Google. À ce stade, une solution possible est le code de réponse 410. Cependant, vous ne devriez considérer cette alternative que si vous êtes certain que cette page ne sera plus jamais utile, car 410 signifie une suppression définitive. En appliquant les mesures appropriées, tous les Soft 404 devraient également disparaître.
Cependant, une accumulation de ces erreurs n'est en réalité pas grave pour Google. John Müller l'a confirmé dans un hangout du 6 avril 2017 (à partir de 37:38). Dans l'outil Google Search Console, vous pouvez indiquer les erreurs 404 corrigées puis en informer Google.
Illustration 10 : Marquer comme "corrigés" dans Google Search Console
Avec le module Website Success, Ryte vous offre également la possibilité d'identifier les pages 404. Pour ce faire, sélectionnez l'onglet "Sitemap" dans le module puis cliquez sur "Codes de statut du fichier".
Illustration 11 : Contrôler les codes de statut 404 avec Ryte
En cliquant sur le rectangle rouge intitulé 4xx (non trouvé), vous pouvez visualiser toutes les URL qui conduisent à une page d'erreur.
Illustration 12 : Ouvrir toutes les URL avec le code de statut 404
On désigne par "erreur Soft 404" le phénomène consistant à ce que le serveur restitue un code différent lorsque l'URL demandée par un client n'est plus disponible sur le serveur. Alors que les erreurs 404 surviennent régulièrement sur les pages Web et n'affectent pas les classements de manière négative, une erreur Soft 404 peut avoir une conséquence. Cela est dû au fait que Google est plus ou moins "trompé" par le contenu de la page et indexe potentiellement deux fois les URL ou ne peut l'explorer à cause de la fausse erreur 404.
Dans ce contexte, il est également important de noter que les URL inexistantes qui sont redirigées vers la page d'accueil via une redirection 301 sont évaluées comme des erreurs Soft 404 par Google.
Les erreurs 404 sont au Web ce que les fautes de frappe sont aux textes ou les produits en rupture de stock aux magasins. Si des erreurs 404 s'accumulent, il est impératif de vérifier la configuration de votre serveur ou les liens internes. Il s'y trouve peut-être quelques fautes de frappe ou encore d'anciennes URL après une relance.
Cependant, la façon dont vous gérez ces erreurs et la création d'une page d'erreur correspondante sur votre serveur sont beaucoup plus importantes. En effet, avec une page d'erreur bien mise en forme, vous vous assurez que les visiteurs ne quittent pas immédiatement votre site lorsqu'ils ne trouvent pas l'URL désirée.
Détectez vos pages d'erreur Ryte FREE !
Écrit le 02.11.2017 par Philipp Roos.
En tant que membre de la famille élargie d’Ryte, Philipp apporte régulièrement son soutien et son expertise au Ryte Magazine. Cet ancien étudiant en littérature allemande se réjouit chaque jour que l’époque des textes bourrés de mots-clés invisibles pour de meilleurs classements est enfin révolue..
Suivi, analyse et optimisation de vos actifs numériques grâce à notre technologie unique
S’inscrire gratuitement