Ce n’est plus nouveau que les moteurs de recherche font de plus en plus appel à l’intelligence artificielle.
Contrairement à la recherche traditionnelle, basée sur les mots-clés, Google recueille désormais la totalité du contenu d’un site à l’aide d’algorithmes, tels que le Rank Brain, et établit des relations sémantiques afin de fournir des résultats de recherche encore plus pertinents aux internautes. Petit tour d'horizon d'une optimisation qui place au coeur la recherche sémantique.
Afin d’expliquer la terminologie liée au Web sémantique, il est nécessaire de remonter aux origines du "Web classique". En 1989, Sir Timothy John Berners-Lee, physicien et informaticien britannique, a inventé l’Hypertext Markup Language (HTML) et, par extension, le World Wide Web. Il a mis en ligne le tout premier site internet, http://info.cern.ch, pour l’Organisation européenne pour la recherche nucléaire (CERN).
Le Web classique comprenait les normes de base suivantes : les URL comme adresses Internet, l’HTTP comme protocole afin de consulter ces adresses et de pouvoir modifier les contenus sous-jacents, et l’HTML comme langage de programmation pour les documents au format texte.
Douze ans plus tard, Tim Berners-Lee a expliqué comment le Web classique, qui s’était alors considérablement développé, est devenu le Web sémantique :
Afin de "faciliter" cette collaboration entre l’Homme et la machine, les webmasters doivent appliquer les conseils ci-dessous et rédiger leurs contenus web de manière à ce que les algorithmes puissent les lire correctement.
Dans le cadre de la recherche sémantique, la recherche ne s’effectue plus seulement sur des mots-clés individuels, mais également sur la signification du contenu du texte dans sa totalité. Tout comme le cerveau humain, la recherche sémantique s’appuie sur des connaissances et des associations. C’est la raison pour laquelle les exploitants de sites web doivent consigner leurs documents à l’aide de données structurées afin que le moteur de recherche puisse analyser correctement les homonymes et les synonymes.
Illustration 1 : recherche de "verre" (2017) : résultats pertinents avec l'objet de vaisselle et le matériau
Un homonyme est un mot qui désigne plusieurs concepts à la fois. Par exemple, si le terme "verre" apparaît sur un site web, il est nécessaire de déterminer s’il s’agit du verre pour boire, d’un matériau ou du verre de lunette. L’utilisation de synonymes lors de la requête de recherche permet de compléter les résultats de la recherche. Afin de fournir des résultats de recherche pertinents aux utilisateurs, Google utilise son protocole Web pour l’analyse sémantique.
À l’aide des outils de suggestion et de saisie semi-automatique, Google propose directement des combinaisons de mots-clés alternatifs (keyword phrases) lors de la saisie des termes de la recherche.
Illustration 2 : Proposition pour "verre" dans Google Suggest
Lorsque les linguistes examinent le contenu sémantique d’un mot, ils parlent d’"analyse sémantique". Les moteurs de recherche suivent ce principe directeur : à l’aide de l’analyse sémantique, les moteurs de recherche tels que Google ou Bing déterminent le thème du site web et proposent aux utilisateurs des résultats pertinents. Les conditions préalables à cette spécialisation ont été mises en place par Google dès 2013, lors de la mise à jour Hummingbird.
L’analyse sémantique améliore les résultats de recherche et fonctionne de manière ciblée. Pour ce faire, Google ne veille pas seulement à l’optimisation technique irréprochable d’un site web, mais également aux contenus centrés utilisateur (textes, images, vidéos, etc.).
L’importance de la mise à disposition par Google des informations adéquates est par exemple démontrée par une recherche sur le terme "jaguar". Sur la première page de résultats, on trouve uniquement des sites en relation avec la marque de voitures. Les sites concernant les félins du même nom sont référencés sur la quatrième page. La bibliothèque d’images située sur la première page de résultats est quant à elle uniquement composée de photos d’animaux.
Illustration 3 : Recherche de "jaguar" sur la première page : uniquement des résultats sur le véhicule
Illustration 4 : Recherche de "jaguar" sur la première page de recherche d'images Google : beaucoup de photos de l'animal
Dans ce contexte, la nouvelle fonctionnalité de recherche d’images intitulée "Produits similaires" introduite par Google sur les navigateurs mobiles et sur l’application Google pour appareils Android est particulièrement intéressante. Grâce à la reconnaissance automatique, les utilisateurs peuvent désormais trouver des produits qu’ils ont vus dans la recherche d’images Google et recevoir des propositions concernant des produits similaires.
À l’heure actuelle cependant, cette fonctionnalité fonctionne uniquement pour les sacs à main, les chaussures et les lunettes de soleil. Les produits des catégories Vêtements, Maison et Jardin seront ajoutés dans les mois à venir. Si vous vendez également des produits, il est conseillé de consigner les sous-pages pertinentes avec des balises produit structurées schema.org.
Le Knowledge Graph de Google fait également partie de l’analyse sémantique concernant les résultats de recherche. Celui-ci se fonde sur une base de connaissances dans laquelle sont collectées des informations concernant des personnes, des lieux et des événements, ainsi que les relations qui les unit. Pour compiler les données, Google utilise un algorithme qui explore l’index à la recherche de données structurées. Les résultats issus de Wikipédia sont souvent cités. Grâce au Knowledge Graph, il est possible de trouver des choses sans pour autant les nommer directement.
Ainsi, à la question "Quelle taille fait Brad Pitt ?", Google apporte non seulement la réponse exacte à la question, mais il fournit également le Knowledge Graph détaillé contenant les informations principales concernant l’acteur américain (voir illustration 5).
Illustration 5 :Résultat de recherche avec le Knowledge Graph
Le Rank Brain est un algorithme installé en 2015 par Google, fondé sur l’apprentissage automatique et qui intègre l’intelligence artificielle. À l’heure actuelle, RankBrain est le troisième facteur de classement le plus important pour Google, juste derrière les liens et le contenu. Ainsi, les moteurs de recherche peuvent classer correctement les termes de recherche ambigus, comprendre les néologismes et les termes familiers et donc afficher de meilleurs résultats pour les commandes vocales.
Ce point est particulièrement important pour les requêtes de recherche les plus récentes, qui sont saisies pour la première fois, notamment certains mots, certaines phrases ou certaines questions. À chaque fois, le moteur de recherche doit comprendre l’intention de l’utilisateur : que recherche exactement l’utilisateur ? Face à des problèmes linguistiques tels que l’existence de synonymes, l’ambiguïté, le sens (intention) et la signification (extension), le Rank Brain est utilisé afin de mieux analyser les requêtes complexes.
RankBrain semble se fonder sur un modèle de conversation qui établit une relation entre les requêtes de recherche précédentes afin de prédire la prochaine séquence. Si le système vise juste, les séquences devinées sont intégrées au contexte pour la prochaine requête. L’exemple ci-dessous met en évidence l’intelligence des réactions de Google face aux questions rarement posées.
Illustration 6 : résultat de recherche pour l'intention utilisateur "chaîne alimentaire"
Dans la question "Quel être vivant est au sommet de l’alimentation ?", le terme intentionnel est "chaîne alimentaire". Même si ce mot n’est pas utilisé dans la question, Google affiche des résultats en relation étroite avec ce sujet. Les termes "être vivant", "base de l’alimentation", "cycle alimentaire" et "nourrir" ont été pris en compte. Il convient également de noter qu’aucun produit n’est affiché et que les résultats contiennent exclusivement des contenus rédactionnels en lien avec la science.
Lorsqu’il rencontre des mots inconnus, le Rank Brain établit des relations sémantiques avec des entités linguistiques déjà connues. À l’heure actuelle, ce sont encore les ingénieurs qui apprennent au système comment contourner les termes inconnus et les mettre en relation les uns avec les autres. À l’avenir, le système devrait cependant être capable d’apprendre par lui-même. Le Rank Brain est donc bien plus qu’un simple algorithme : c’est un processus d’apprentissage. C’est la raison pour laquelle vous ne pouvez pas influencer directement le Rank Brain. Il est cependant essentiel de faire attention à certains éléments :
Avec le SEO sémantique, vous pouvez laisser des "traces" à l’attention de vos lecteurs et des moteurs de recherche afin d’être trouvé plus facilement. Étant donné que les filtres par thème de Google sont de plus en plus efficaces, tout dépend désormais de la qualité de vos contenus et du fait que les moteurs de recherche peuvent comprendre le contexte.
Lors de l’optimisation de vos contenus, vous devez vous poser les questions suivantes :
Une fois que vous avez répondu à ces questions, vous pouvez optimiser votre contenu sur le plan de la recherche sémantique à l’aide des conseils concrets ci-dessous.
1. Élargissez votre plan de mots-clés : La règle selon laquelle il convient d’optimiser chaque URL autour d’un mot-clé unique est obsolète. Élargissez votre plan de mots-clés à des termes qui appartiennent au même thème.
2. Démarquez-vous de la concurrence : Démarquez-vous de vos concurrents à l’aide d’informations exhaustives, actuelles et pertinentes pour votre groupe-cible.
3. Effectuez un contrôle régulier : Effectuez des recherches dans les 10 premiers résultats des SERP à intervalles réguliers et déterminez les points que vous pouvez encore améliorer à partir des modifications dans le classement.
4. Utilisez des cooccurrences : Obtenez des liens et des mentions dans des environnements rédactionnels correspondant au thème et insérez vous-même des liens vers des sites pertinents. Ainsi, vous établirez un environnement thématique comportant un grand nombre d’interconnexions pour votre site web.
5. Augmenter l’autorité : Le choix d’un nom de marque et d’un nom de domaine dans un environnement thématique adéquat vous permet de renforcer votre propre degré de notoriété.
6. Utilisez le owned media : Proposez à vos lecteurs une valeur ajoutée supplémentaire sur le thème que vous traitez à travers vos propres canaux rédactionnels, comme par exemple les blogs d’entreprise, les réseaux sociaux ou les newsletters.
1. Utilisez des synonymes : Lors de la rédaction de votre texte, enrichissez le champ lexical utilisé à l’aide de synonymes au lieu d’utiliser toujours les mêmes mots. N’oubliez pas les formes du pluriel.
Les contenus textuels uniques sont la base des sites web prospères et durablement optimisés. À l’aide de l’analyse de pondération de texte TF*IDF, vous pouvez déterminer la pondération des mots-clés au sein d’un document dans le cadre de l’optimisation OnPage. TF signifie term frequency tandis qu’IDF correspond à inverse document frequency.
La feature TF*IDF proposé par Ryte vous accompagne lors de cette analyse, au cours de laquelle la fréquence des termes des 15 sites les mieux classés portant sur un mot-clé déterminé est analysée automatiquement. À l’aide de la courbe ainsi obtenue, il est non seulement possible de rédiger des textes originaux, mais également de compléter les contenus existants à l’aide de termes importants. Il ne s’agit pas d’une optimisation des mots-clés, mais cet outil vous aide à créer des contenus présentant une véritable valeur ajoutée pour les utilisateurs.
Illustration 7 : Analyse TF*IDF avec Ryte Content Success
Google s’efforcent de proposer à ses utilisateurs les meilleurs résultats possibles. En effet, des contenus rédigés de manière compréhensible et qui contiennent des distinctions sémantiques sont déterminants pour l’utilisabilité.
Le Knowledge Graph, les Featured et les snippets enrichis ainsi que les Rich Cards indiquent de quels produits, articles, services ou domaines le site traite. Lorsque ceux-ci sont bien classés dans les résultats de recherche, le taux de clics augmente également.
À travers l’utilisation de données structurées de schema.org, vous pouvez influencer en partie l’affichage de votre site web dans les SERP. Sur le site schema.org, vous trouverez un ensemble de balises et de markups HTML pour l’utilisation des Rich Snippets, notamment dans les domaines suivants : articles, évaluations, personnes, prix, entreprises, événements ou restaurants.
Illustration 8 : Un snippet enrichi avec étoiles de notation et indication sur le temps de préparation
L’importance de l’optimisation pour les moteurs de recherche évolue de manière spectaculaire. Par ailleurs, vous devez évidemment veiller à ce que votre site web fonctionne sans problème technique. Cependant, si vous ne portez pas une attention accrue aux contenus textuels, vous ne pourrez pas maintenir le rythme sur la durée si vos concurrents font un meilleur travail.
L’importance de l’optimisation sémantique devient d’autant plus significative lorsque l’on jette un œil aux évolutions actuelles dans le domaine de la recherche vocale. À travers les technologies sémantiques, les assistants personnels intelligents (IPA) modifient notre manière de communiquer – et pas seulement sur Internet. Les assistants vocaux tels que Cortana, Siri, Alexa ou le Google Assistant concrétisent directement des ordres oraux, comme par exemple "Appelle Suzanne". L’utilisateur du téléphone mobile ou de la tablette n’a donc plus besoin de sélectionner le numéro. À chaque question posée, l’assistant mobile développe ses capacités. Par exemple, si les prévisions météorologiques sont maussades, Siri répond à la question "Quelle sera la météo demain ?" de manière amicale et bienveillante par "N’oubliez pas d’emporter votre imperméable demain !" et affiche les prévisions météo locales pour le jour suivant.
Grâce à la recherche sémantique et aux assistants vocaux, Google dispose d’outils précieux pour afficher les résultats adéquats aux groupes-cibles appropriés. Les questions et les phrases complexes ne sont plus un obstacle mais un avantage. Profitez-en et concevez vos contenus de manière aussi attrayante et exhaustive que possible.
Trouvez les bons mots-clés avec Ryte Content Success
Écrit le 28.04.2017 par Eva Wagner.
Eva rassemble beaucoup d'expérience dans le marketing. En 2015, elle devient un super-héros à Ryte. Avec beaucoup de créativité et un sens affiné pour les sujets d'actualité, elle gérait les activités de rédaction de Ryte. Elle organisait aussi la participation de l'entreprise à de grands événements et salons, comme la dmexco de Cologne.
Suivi, analyse et optimisation de vos actifs numériques grâce à notre technologie unique
S’inscrire gratuitement