Big Data


Big Data fait référence à la fusion de données provenant de différentes sources afin d'obtenir un ensemble de données le plus complet possible. Des analyses visuelles peuvent aider à mieux interpréter ces données. La quantité totale de données est utilisée pour un targeting plus efficace ou pour améliorer la gestion de la relation client (customer relationship management, CRM). L'objectif global du Big Data est une augmentation des conversions ou des ventes. Les bases de données considérées comme très volumineuses nécessitent des capacités de stockage qui ne peuvent plus être mesurées en gigaoctets. Cependant, il n'y a pas de limite fixe qui détermine quand on commence à parler de Big Data.

Développement[modifier]

Avec le développement rapide des supports de stockage, il existe encore plus de moyens d'analyser de grandes quantités de données et d'en tirer profit.  La quantité de données à l'échelle mondiale a parallèlement tout autant augmenté. On prévoit que le volume de données doublera tous les deux ans dans le monde. La raison en est la numérisation croissante à l’échelle planétaire. Alors que les bases de données étaient auparavant complétées et maintenues manuellement, elles sont aujourd'hui gérées par des machines et des ordinateurs toujours plus rapides. Qu'il s'agisse de faire des achats en ligne, de réserver un voyage, de commander un repas au restaurant ou de gérer les données de son assurance maladie, chaque étape est enregistrée, gérée et organisée par ordinateur.

Le Big Data est donc la conséquence d'une tendance générale de l'humanité à produire des volumes de données toujours plus importants. Aujourd'hui, le Big Data est utilisé à la fois dans la science et dans l’économie mondialisée.

Prérequis techniques[modifier]

Le traitement de grandes quantités de données nécessite de nombreuses étapes. Mais le Big Data ne peut plus être traité efficacement avec la technologie conventionnelle, car cela présuppose que le logiciel peut traiter les exigences suivantes :

  • traiter plusieurs entrées à la fois
  • importer rapidement de grandes quantités de données
  • rendre les bases de données disponibles rapidement
  • gérer plusieurs requêtes de base de données en même temps


Ces conditions primaires sont remplies par des programmes payants tels que NeuroBayes, mais aussi par des logiciels tels que Hadoop.

Big Data : domaines d’application[modifier]

Les grandes entreprises en particulier voient de grands avantages dans le Big Data, qui leur permet de se distinguer de leurs concurrents qui disposent de moins de données. Dans le même temps, il est possible d'économiser beaucoup d'argent lorsque des processus de gestion dans leur intégralité peuvent être contrôlés sur la base de données lues automatiquement. Même dans le domaine scientifique, les nouvelles méthodes d'évaluation qui utilisent une base statistique ne sont possibles qu'à l'aide du Big Data.

Les applications suivantes sont envisageables et sont utilisées dans la pratique dans les scénarios suivant :

  • Études de marché automatisées et rapides qui peuvent réagir immédiatement aux changements
  • Détection de fraude dans les transactions financières
  • Analyse Web complète pour augmenter et optimiser les campagnes de marketing en ligne
  • Diagnostic médical complet
  • Maîtrise de la consommation d'énergie, par exemple avec un réseau intelligent
  • Possibilités élargies en matière de e-commerce par le biais de ventes incitatives flexibles ou de ventes croisées
  • Enquêtes par sondage ou profilage pour les services de renseignement ou la police


Critique du Big Data[modifier]

Le Big Data est un élément important du marketing digital. Les grandes entreprises peuvent travailler avec des ensembles de données plus importants qui offrent un plus grand potentiel de marketing. Cependant, le Big Data, tout comme le ciblage, sont souvent critiqués parce que les grandes quantités de données permettent de créer des profils utilisateurs très précis. Le Big Data peut alors s’apparenter à une énorme invasion dans la vie privée des utilisateurs. Les entreprises qui travaillent avec le Big Data sont tenues d’informer leurs clients ou visiteurs dans le cadre de leur politique de confidentialité que les données des utilisateurs sont traitées ultérieurement.

Des entreprises comme Google ou d'autres fournisseurs de moteurs de recherche, qui sont notamment financés par la publicité, travaillent depuis des années avec d’énormes quantités de données obtenues à partir des données des utilisateurs et d'autres sources disponibles. Les débats réguliers sur la protection de la vie privée illustrent le domaine problématique du Big Data, car cela confère aux entreprises une trop grande suprématie sur les données. Il existe par ailleurs toujours le risque que les données soient mal utilisées et que cet abus nuise aux citoyens à long terme.

Le Big Data est également critiqué dans la mesure que les données ne peuvent être analysées que sur une base algorithmique, en raison de l'immense quantité de données concernées. Ces algorithmes ont de plus une orientation très technique. Cependant, l'industrie des technologies de l'information se trouve au tout début du traitement de grandes quantités de données et on peut s'attendre à ce que des méthodes d’évaluation plus précises soient rapidement développées.

Importance pour le SEO[modifier]

Considérant les options fournies par les outils d’analyse Web tels que Google Analytics, il est évident que les professionnels du SEO bénéficient pleinement du Big Data. Les référenceurs obtiennent leurs résultats depuis d’énormes ensembles de données clairement présentés, qui leur permettent d’optimiser leurs projets à plusieurs niveaux : comparaisons, outils de mots-clés, etc.

Les grandes entreprises peuvent de même obtenir des informations importantes pour leurs stratégies de référencement et de targeting si elles viennent à fusionner leurs bases de données.

Pour aller plus loin[modifier]