Analyse fichier journal


À l’aide d’une analyse des fichiers journaux, il est possible de recueillir des statistiques sur les vues de page et sur les indicateurs relatifs à l’utilisation d’un site web, ou plutôt du serveur web. À la base de l’analyse des fichiers journaux, il y a bien sûr la lecture desdits fichiers. Aujourd’hui, les outils d’analyse utilisent le marquage de page dans de nombreux cas afin de mener une analyse conventionnelle. Il ne faut pas confondre cette procédure avec le marquage social (en anglais “social tagging”).

Évaluation des fichiers journaux[modifier]

Lorsque les webmasters ont accès aux fichiers journaux d’un site web, ils sont souvent confrontés à une grande quantité de données. Pour de très petits projets avec peu de vues de pages, la lecture de ces données et l’attribution de domaines individuels peuvent être réalisées manuellement. Mais dès que le trafic augmente et que des périodes de données plus longues sont applicables, des programmes spéciaux sont nécessaires, au sein desquels les données des fichiers journaux sont saisies puis triés selon différents aspects.

Éléments de l’analyse des fichiers journaux[modifier]

L’analyse des fichiers journaux peut permettre le classement de paramètres de base concernant l’utilisateur d’un site web.

  • Adresse IP et hébergeur
  • Région ou pays d’origine
  • Navigateur et système d’exploitation utilisés
  • Accès direct par l’utilisateur ou référence depuis d’autres sites web ou campagnes publicitaires
  • Type de moteur de recherche et mot de recherche entré
  • Dwell time et nombre de pages recherchées par l’utilisateur
  • Page sur laquelle l’utilisateur a quitté le site

Avantages de l’analyse du fichier journal[modifier]

Une analyse des fichiers journaux procure les avantages suivant :

  • Réorganisation de données de l’historique : le serveur web enregistre continuellement les fichiers journaux. Quand les fichiers sont toujours sauvegardés, ils peuvent donc être évalués de manière flexible.
  • Le trafic demeure au sein de son propre réseau : si on mène une analyse du fichier journal et qu’on ne délègue pas cette dernière à un prestataire externe, on conserve le contrôle sur ses données d’accès.
  • Mesures des téléchargements interrompus : au cours de la sauvegarde du serveur web, toutes les données qui ont été déposées et qu’un utilisateur peut télécharger sont rassemblées au sein d’un seul fichier journal. À l’aide d’une estampe chronologique, il est possible d’enregistrer avec précision certains points forts, comme combien de temps et combien de documents un utilisateur a-t-il téléchargé. Les problèmes pouvant survenir au cours du téléchargement de données peuvent donc être identifiés grâce à l’analyse de ce fichier journal.
  • Les pares-feu ne gênent pas le protocole : si un site web est accessible depuis un certain serveur, le pare-feu n’intervient pas. Le fichier journal peut ainsi surveiller et enregistrer les accès.
  • Enregistrement automatique des crawlers : les fichiers journaux enregistrent automatique chaque visite du serveur. Cela inclut également les accès par les robots des moteurs de recherche.
  • JavaScript ou les cookies ne sont pas nécessaires : Contrairement aux outils de web analytique, l’analyse du fichier journal ne requiert pas le JavaScript ou l’usage des cookies. De cette façon, l’analyse est moins sujette à des problèmes techniques. En outre, les fichiers journaux peuvent aussi être enregistrés lorsque les utilisateurs bloquent les outils de web analytique.
  • Traitement simple : si le fichier journal est trop grand, les données peuvent être lues et segmentées avec des programmes de traitement de données classiques, comme Excel. Ainsi, un logiciel de solution complexe n’est pas nécessaire.

Désavantages de l’analyse du fichier journal[modifier]

  • Caching et proxy : comme un fichier journal peut seulement enregistrer des données, au moyen desquelles un accès direct au serveur est permis, tous les accès qui résultent de la mémoire cache du navigateur via un serveur proxy sont supprimés.
  • Mises à jour régulières nécessaires : pour que les fichiers journent livrent des chiffres corrects, le logiciel doit être constamment mis à jour par le webmaster. Cela se traduit par des frais de maintenance.
  • Charge de mémoire supplémentaire : comme les fichiers journaux sont enregistrés automatiquement, la quantité de données peut rapidement devenir très importante par un nombre élevé de visiteurs, car chaque accès au serveur est enregistré. Quiconque mène une analyse des fichiers journaux pour de gros sites web a besoin de ressources de mémoire supplémentaires.
  • Traitement complexe des données pour les gros volumes : pour réaliser une analyse des fichiers journaux, chaque fichier journal doit d’abord être inscrit dans un programme de traitement de données. Cela implique du travail supplémentaire, surtout lorsqu’on procède à de très nombreuses sauvegardes.
  • Aucun suivi des widgets ou Ajax : un fichier journal peut seulement stocker les données qui résultent des demandes du serveur. Si des actions sont réalisées sur une page au moyen d’Ajax, elles ne se trouveront pas dans le fichier journal, car il ne s’agit pas d’une vraie requête du serveur.
  • Affectation inexacte des visites : si un visiteur emploie une attribution IP automatique et multiplie les accès à une page en particulier, il apparaît dans le fichier journal plusieurs accès, alors qu’il s’agit du même utilisateur. Ainsi, le comptage du trafic est inexacte. Il en va de même lorsque plusieurs utilisateurs accèdent à un site web avec la même adresse IP. Ils seront seulement comptabilisés en tant qu’un seul visiteur.
  • Moins de données : par rapport à des outils de web analytique, l’analyse des fichiers journaux fournit moins de données. Vous ne pouvez pas obtenir des indicateurs clés de performance, tels que le taux de rebond.

Usage pratique pour le référencement[modifier]

À l’aide de l’analyse des fichiers journaux, les professionnels du SEO ont la possibilité d’évaluer et de travailler sur les données relatives au trafic. Dans le même temps, aucune donnée n’est transmise à un prestataire de service externe. Il n’y a donc aucun problème pour la protections des données. Cependant, les possibilités se limitent à l’analyse, ce qui explique pourquoi l’analyse des fichiers journaux ne doit pas être utilisée comme une seule et unique méthode d’analyse, mais comme un outil complémentaire ou un instrument de test, tout comme Google Analytics est par exemple utilisé.

Pour les plus grands sites web, l’analyse des fichiers journaux est également liée au traitement de très grands volumes de données, ce qui nécessite une infrastructure informatique performante sur le long terme.

Liens web[modifier]