RankBrain

Le RankBrain est un nouveau sous-système d’algorithmes que Google utilise dans la distribution des résultats de recherche ou dans les SERP. Le RankBrain utilise l’apprentissage machine et l’intelligence artificielle pour répondre à des questions qui n’ont jamais été posées. Le système intègre la langue parlée sous forme de recherches dans des schémas mathématiques qui peuvent être traités par le moteur de recherche. Le RankBrain complète les différents algorithmes pour la catégorisation de ces nouvelles recherches. Il utilise aussi la recherche sémantique, qui a été intégrée avec la mise à jour Hummingbird, tout en associant des mots inconnus à des entités linguistiques déjà connues. Le système est conçu pour apprendre de cette façon dans le futur.

Informations générales

Google reçoit des millions de recherche par jour. Environ 15% de toutes les recherches reçues par Google sont complètement nouvelles. Elles comprennent de nouveaux concepts, des phrases et des questions. Afin d’évaluer correctement ces modèles de langage souvent très complexes et de fournir des résultats pertinents, Google affirme utiliser plus de 200 signaux différents, une infrastructure complexe et diverses mises à jour conçues pour améliorer les résultats de recherche.

Après des années de recherche, Google a mis en place le système du RankBrain, lancé au début de l’année 2015 après une courte période d’essai. Le RankBrain a d’abord été testé et comparé avec des utilisateurs réels, qui ont correctement assigné 70% des nouvelles recherches alors que le RankBrain atteignait un score de 80%. Étant donné que le système peut apprendre de manière presque autonome, il est rapidement devenu partie intégrante de la recherche Google. En plus des liens et des signaux sémantiques, qui sont probablement les facteurs de classement les plus importants, le RankBrain est déjà devenu un des signaux les plus importants.

Cinq développeurs qui examinaient et évaluaient l’apprentissage machine et l’intelligence artificielle dans le cadre de la recherche furent nommés responsables du projet. Avec l’acquisition de DeepMind en 2014 et la nomination de Ray Kurzweil en 2012, la société avait déjà jeté les bases de ses propres recherches dans le domaine de l’intelligence artificielle quelques années auparavant. Le système RankBrain complète donc le produit principal, qui est la recherche Google, avec un système qui est destiné à prendre en charge la recherche conversationnelle, les termes d’argot, la recherche vocale ainsi que la mise en place de Google dans le domaine de l’intelligence artificielle dans les années à venir. [1]

Comment ça marche

Tout comme pour d’autres mises à jour ou modifications de l’algorithme de base, Google ne fournit pas beaucoup d’explications sur la façon dont fonctionnent les mécanismes exacts du RankBrain. Un seul communiqué de presse a intégré une interview à ce sujet de Greg Corrado[2], le chercheur principal. Selon lui, le RankBrain utilise l’intelligence artificielle pour intégrer le langage des entités mathématiques, appelées vecteurs. Si le RankBrain reçoit un mot inconnu ou une phrase de recherche sous la forme d’une requête, il devine le sens des caractères en collectant d’importantes similitudes avec des mots qui existent déjà dans la base de données : les historiques de recherche sont introduits dans le système. Si ces associations sont correctes, elles peuvent être intégrées dans le système en direct. La distribution des résultats de recherche est ensuite modifiée en fonction des données, afin que les sites web et les applications concernés puissent être affichés à l’utilisateur : cela vaut particulièrement pour les recherches qui n’ont jamais été réalisées, notamment avec des termes longue traîne ou contenant des mots ambigus. [3]


Le RankBrain esquisse l’algorithme Hummingbird et la recherche sémantique pour au moins comprendre à un niveau rudimentaire les significations de certains énoncés. Dans le cadre de Hummingbird, les recherches individuelles sont traitées comme des entités et non des chaînes, puis annotées par le Knowledge Graph pour comprendre par exemple le type de requête (transactionnel, navigation, recherches d’informations). Mais le système n’a pas encore été capable de gérer des requêtes complexes avec plusieurs termes de différents contextes.

Par conséquent, le RankBrain est destiné à gérer spécifiquement les requêtes qui se composent de combinaisons de plusieurs termes, de mots-clés longue traîne, de questions et de recherches conversationnelles. Les moteurs de recherche ont toujours eu des problèmes avec un langage complexe dans la communication homme-machine, car les significations ne pouvaient pas être modélisées. Le RankBrain se base apparemment sur un modèle conversationnelle incorporé à un cadre de “séquence à séquence”.

Ainsi, le modèle utilise un contexte de recherches précédentes (séquence) pour deviner la prochaine séquence. Si le système est correct, les séquences qui ont été devinées seront ensuite transférées dans le contexte. En mettant un application l’apprentissage machine, le système est destiné à améliorer le traitement des requêtes complexes. À l’heure actuelle, ces recherches sont toujours en cours de traitement par des ingénieurs qui enseignent au système comment traiter des termes inconnus. On peut supposer que, à long terme, le système pourra accomplir cette tâche de manière indépendante.

Importance pour l’optimisation du référencement

À ce jour, le RankBrain est considéré comme le troisième signal le plus important dans le tri des résultats de recherche. Greg Corrado a lui-même été surpris que le système fonctionne mieux que prévu. Bien qu’il n’y eu aucune date pour le lancement du RankBrain, il semble que le système est probablement compatible avec l’interprétation de la requête depuis des mois maintenant. Le RankBrain ne doit pas être interprété comme une mise à jour ou un algorithme, mais plutôt comme un processus qui soutient le moteur de recherche dans la compréhension des requêtes de recherche.

Le RankBrain ne traite pas nécessairement toutes les recherches comme c’est le cas du système principal. Seules les recherches qui n’ont jamais été effectuées avant ou des requêtes complexes composées de plusieurs mots ou phrases passent par ce système. Les synonymes, l'ambiguïté, l'intension et l’extension sont des problèmes linguistiques que Google essaie de résoudre en enseignant au système comment interpréter les termes et comment les relier les uns aux autres.

Plus la base de données est grande, plus les prévisions seront précises - les ingénieurs de Google y travaillent d’ailleurs continuellement. Le RankBrain est encore à seulement quelques pas du développement de l’intelligence artificielle ou de l’apprentissage machine. Néanmoins, le système fera de la langue parlée un sujet d’optimisation du référencement. Cela se réfère également à des aspects tels que le marketing de contenu, le balisage sémantique, les données structurées et le contenu général utile du site web.

Références

  1. RankBrain, AI, and the Evolving Anatomy of Google blog.searchmetrics.com
  2. Google Turning Its Lucrative Web Search Over to AI Machines bloomberg.com
  3. RankBrain: Everything We Know About Google’s AI Algorithm thesempost.com

Liens web

Catégorie