Erreur Soft 404


Une erreur Soft 404 se produit lorsqu’un utilisateur appelle un site web inexistant ou incorrect avec son navigateur et que le serveur envoie un code de statut HTTP "200 OK" ou "302 Trouvé" au client (navigateur). L’utilisateur voit un code d’erreur 404 sur son écran, mais le serveur transmet un code de réponse différent lors de la communication entre le client et le serveur web. Le contenu du site web n’est donc pas lié avec la réponse HTTP du serveur.

Cela peut affecter l’exploration et l’indexation du site demandé. En outre, ce peut être frustrant pour les utilisateurs car la réponse du serveur ne correspond pas à leur requête de recherche.

Informations générales sur le sujet

En règle générale, un serveur envoie un code d’erreur "404 non trouvé" chaque fois qu’un site web demandé n’existe pas, n’est plus présent sur le serveur ou si l’URL est corrompue. C’est souvent le cas lorsqu’une ressource est stockée dans un autre emplacement sur le serveur, ou en d’autres termes que le contenu a été déplacé et les liens internes qui indiquent la ressource n’ont pas été corrigés. Un code d’erreur 404 peut également s’afficher si les liens externes indiquent une ressource qui n’existe plus. Cela s’appelle des liens morts. Le serveur envoie également un code d’erreur 404 si une URL correcte a été modifiée par l’utilisateur.

Le Soft 404 diffère de ce cas car le serveur répond avec un code de statut HTTP tel que 200 ou 302, même si le site n’existe plus, alors qu’un 404 serait la bonne réponse. Le serveur interprète une URL incorrecte ou invalide comme une adresse correcte et redirige par exemple vers la page d’accueil.

Des problèmes peuvent apparaître car le serveur transmet non seulement des codes de statut aux navigateurs, mais aussi aux moteurs de recherche. Le robot d’exploration avancera progressivement parmis les liens qui lui sont disponibles. S’il rencontre un site qui n’existe plus et qui possède toujours un code de réponse 200 ou 302, il traite cette ressource comme un site web normal avec du contenu. Cela peut signifier qu’il ne l’explorera plus et se dirigera vers d’autres pages du domaine, car il dépense un temps limité sur chaque site web de la toile. Ainsi, il explore des ressources qui ne contiennent aucune information intéressante et les utilisateurs reçoivent un contenu qu’ils n’ont pas demandé.

Comment corriger une erreur Soft 404 ?

Les erreurs d’exploration sont listées sous l’élément "Diagnostique" dans le menu du Google Search Console. Si des erreurs Soft 404 sont recensées, les étapes suivantes peuvent être entreprises :

  • l’URL peut être vérifiée
  • si le contenu est correct, le site doit renvoyer un code 200 OK.
  • si la réponse est un code 301, redirigez l’URL vers un site plus approprié.
  • si aucun site n’existe sous cette URL, un code 404 ou 410 devrait être intégré dans l’en-tête de la page.

Il est très important que le serveur émette un code de statut correct en réponse à une demande. Un site web pourrait être supprimé de l’index si ce n’est pas le cas.

Des extensions telles que Firebug ou l’outil Fetch de Google sont très utiles. Elles permettent aux webmasters de voir si la communication HTTP entre le client et le serveur fonctionne et comment le Googlebot lit le site. Les deux versions affichent des codes de statut HTTP. Une comparaison avec le site web qui est appelé par le navigateur révèle des modifications nécessaires. Dans les outils pour les webmasters de Bing, cette opération peut être effectuée dans l’Index Explorer, dans l’élément du menu "erreurs 404".

En règle générale, un code d’erreur 404 n’est émis que pour des URL incorrectes ou des sites web existants. Nous vous recommandons également des pages d’erreur 404 personnalisées afin de fournir aux utilisateurs une alternative au contenu demandé : vous les gardez ainsi en tant que visiteurs sur le site web. Une bonne page d’erreur 404 :

  • produit un code de statut correct
  • comprend des informations concises pour l’utilisateur
  • fournit à l’utilisateur un moyen de naviguer sur le site
  • suggère des pages avec un contenu similaire
  • contient une fonction de recherche afin que l’utilisateur puisse rechercher des mots-clés

Importance pour l’optimisation du référencement

Différents codes d’erreur peuvent se produire lorsqu’un site web est redessiné, si le contenu a été migré ou si des actions promotionnelles saisonnières ont été lancées. Les projets à grande échelle peuvent particulièrement créer des milliers de codes d’erreur. Cependant, les produits qui ne sont plus disponibles et même les sites web avec très peu de contenu (thin content) peuvent entraîner des codes d’erreur Soft 404. L’impact est énorme : les moteurs de recherche peuvent retirer les sites web de l’index, ce qui peut mener à une baisse des ventes dans le cas de sites web commerciaux. Les utilisateurs peuvent parfois être frustrés et le coût de résolution des problèmes augmente proportionnellement au nombre de codes d’erreur émis.

Un contrôle régulier des possibles messages d’erreur est recommandé. Ils ne peuvent pas être tous et complètement évités, mais au moins maintenu à un petit nombre. Dès que les messages d’erreur ont été corrigés, cela devrait être communiqué au moteur de recherche dans le Search Console, afin que le robot puisse explorer le site web avec le code d’erreur corrigé le plus tôt possible. Les résultats de ces changements peuvent avoir un impact indirect sur le trafic si Google retire de l’index ou dégrade certains sites web avec des erreurs Soft 404. Cela peut par exemple se produire lorsque le rapport entre les erreurs Soft 404 et les pages indexées est exceptionnellement élevé. Le budget d’exploration du crawler est alors largement utilisé par les pages d’erreur Soft 404.

Liens web