Modélisation prédictive


Le terme « modélisation prédictive » (en anglais : Predictive Modelling) désigne un ensemble de méthodes qui permettent d’analyser et d’interpréter des données définies afin de déduire des pronostics concernant des événements et des tendances futurs ou le comportement des consommateurs à l’avenir. Ces pronostics doivent ici être considérés comme des probabilités et non comme des conclusions concernant l’avenir qui se concrétiseront forcément. Les résultats des modèles pronostics sont des conclusions envisageables sur le plan statistique concernant le domaine en question dont la vraisemblance dépend de la taille de l’ensemble de données étudié. Plus le nombre de données d’entrée est élevé, plus les données de sortie sont précises. Il n’existe cependant aucune garantie quant à la survenue effective des pronostics.

Informations générales[modifier]

La modélisation prédictive est utilisée dans les domaines et les spécialités les plus divers : le secteur des assurances, le secteur financier, les télécommunications, la science, l’e-commerce, la gestion de la relation client ou l’informatique décisionnelle. En ce qui concerne les applications économiques, ces pronostics peuvent être utilisés comme bases décisionnelles dans le cadre de la planification budgétaire et de l’évaluation des chances et des risques. Une utilisation bien connue de la modélisation prédictive est le calcul des risques dans le cadre d’une assurance vie. Dans le contexte scientifique, il s’agit plutôt de confirmer ou d’infirmer des théories qui décrivent le comportement d’un objet appartenant à un domaine de spécialité précis à l’aide de données. L’évolution démographique des sociétés constitue un parfait exemple pour ce type d’utilisation.

Mode de fonctionnement[modifier]

Trois phases peuvent être différenciées lors de la modélisation. Afin d’augmenter la vraisemblance de certaines conclusions, ces phases sont généralement répétées plusieurs fois et donc partiellement itératives.

  • Training : Les données sont tout d’abord collectées et analysées, soit sur le plan quantitatif, soit sur le plan qualitatif. En ce qui concerne l’application spécifique, des facteurs particulièrement pertinents sont identifiés. Dans le domaine du e-commerce, les historiques d’achat des clients sont par exemple analysés afin de déterminer quels segments de clientèle ont acquis certains produits. L’âge, le sexe, le statut social, les requêtes de recherche et les intérêts peuvent constituer des facteurs pertinents. À partir de ces données, les clients sont répartis en segments et les premiers pronostics sont formulés.
  • Contrôle : Les pronostics déjà formulés sont vérifiés à l’aide de données supplémentaires nouvellement collectées. Dans ce contexte, ces données constituent une autorité de surveillance permettant d’évaluer l’exactitude et la fiabilité du modèle. Le cas échéant, le modèle est modifié. Les ventes additionnelles et les recommandations produits dans le e-commerce sont par exemple échelonnées en fonction de leur contribution dans les bénéfices. Cela signifie que l’on vérifie si les propositions de produits effectuées contribuent effectivement à une augmentation des bénéfices.
  • Pronostics : Dès lors qu’un modèle précis et fiable a été développé, des données de training et de contrôle sont enregistrées afin d’élaborer des pronostics. Si de nouvelles données sont disponibles, des contrôles supplémentaires sont effectués. Les utilisateurs d’une plateforme d’e-commerce reçoivent des propositions concrètes : « Les utilisateurs qui ont acheté le produit X ont également aimé le produit Y ». Ces propositions sont le résultat des différentes phases de la modélisation prédictive. Il est probable que le client XY s’intéresse au produit Y parce qu’il appartient à un segment de clientèle particulier et qu’il a été associé à un certain historique d’achat.

Types de modèles prédictifs[modifier]

En principe, un grand nombre de modèles statistiques et d’analyses de régression différents peuvent être utilisés pour effectuer des pronostics. Dans le cas des applications dans le domaine informatique, il s’agit généralement d’exploration de données et d’apprentissage automatique. Il convient d’une part de trouver des données d’entrée pertinentes sous forme de grands ensembles de données et, d’autre part, les modèles pronostics doivent être capables d’auto-apprentissage afin de réagir automatiquement à l’arrivée de nouvelles données.

Dans la pratique[modifier]

À de nombreux égards, les pronostics sont toujours problématiques puisqu’ils constituent de par leur forme des arguments inductifs. Des résultats ou des conclusions généraux sont établis à partir d’observations empiriques et de cas particuliers. Il est certes raisonnable de tenir pour vraies de telles conclusions lorsque les prémices (les données) sont exactes. Cependant, cela ne signifie en aucun cas que ces conclusions sont logiques et cohérentes ou qu’elles peuvent prétendre être universelles. À cela s’ajoute que les ensembles de données plus étendus permettent certes de parvenir à des prévisions plus exactes, mais qu’un plus grand nombre de données n’est pas toujours synonyme de connaissances approfondies des habitudes du client. Dans ce domaine, les spécialistes recommandent souvent de privilégier les Smart Data aux Big Data.

Ces limitations de la modélisation prédictive sont d’autant plus évidentes lorsque l’on étudie les comportements humains. Pour effectuer des pronostics sur le comportement des clients, le modèle pronostique doit connaître toutes les variables qui influencent ce comportement. Cependant, les êtres humains sont influencés par des facteurs de leur environnement difficilement quantifiables. Chaque modèle est donc limité dans une certaine mesure. Certaines plateformes d’e-commerce telles que Netflix ou Amazon sont toutefois parvenues à générer un supplément de revenus non négligeable à l’aide de la modélisation prédictive.

Importance pour l’optimisation du référencement[modifier]

Dans les domaines de l’analyse Web, du marketing en ligne, de l’optimisation du référencement et des réseaux sociaux, la modélisation prédictive ne permet pas seulement d’évaluer les chances et les risques, mais également de calculer les revenus prévisionnels. Les pronostics servent ainsi à effectuer des projections et à élaborer une planification du budget. Les entreprises de publicités peuvent par exemple décider quels canaux marketing devraient être pris comme exemples en fonction des potentiels. Cela est également valable pour les mesures concernant la fidélisation des clients, la gestion de la relation client, le marketing d'e-mail et de newsletter ainsi que la publicité sur les moteurs de recherche et les réseaux affiliés. Les applications possibles de la modélisation prédictive sont extrêmement nombreuses.

Liens web[modifier]