Web sémantique


Le Web sémantique constitue une extension du World Wide Web ou du Web 2.0 dans laquelle non seulement les informations sont liées les unes aux autres, mais aussi l'importance des objets peut être traitée. On parle aussi de Web 3.0. Pour atteindre l'objectif d'une toile ou Web sémantique, des outils sont utilisés pour transmettre l'importance des contenus aux moteurs de recherche. Dans ce contexte, Google, par exemple, travaille lui aussi sur la recherche sémantique. Une première étape en ce sens a déjà été atteinte avec la mise à jour Hummingbird.

Contexte

Les moteurs de recherche ne peuvent traiter que les informations dont ils ont été alimentés au préalable ou pour lesquelles l'humain a mis à l'avance des règles en place pour le traitement. Dans ce cadre, un ordinateur se distingue d'un être humain, qui peut reconnaître l'importance des objets. La toile sémantique doit désormais faire en sorte que les moteurs puissent mettre automatiquement en relation des contenus et des données en se basant sur des algorithmes afin de déterminer l'importance des contenus.

La recherche sur le Web est un exemple de prérequis pour le Web sémantique. De nos jours, il est difficile d'obtenir une réponse significative à une requête du genre « Pourquoi les bananes ne poussent-elles pas dans les Alpes ? » si un site Web n'utilise pas exactement cette combinaison de mots. Si le Web sémantique fonctionne, les moteurs devraient répondre facilement à ce genre de questions.

Application

L'Homme doit aider les machines à décrire plus précisément les informations disponibles pour permettre à Internet de devenir plus « intelligent ». Le W3C crée déjà des normes en ce sens : http://www.w3.org/standards/semanticweb/. Dans ce cadre, l'aide provient par exemple des soi-disant markups (balisage) ou de normes pour des métadonnées présentées brièvement ci-dessous :

  • RDF (Ressource Description Framework) : les informations d'un site Web peuvent être ici décrites plus précisément. Comme supplément, il y a aussi le RDFa qui permet d'ajouter RDF dans des documents XML.
  • Dublin Core : il s'agit ici d'une norme générique permettant de décrire des métadonnées pour le contenu d'un document numérique sous une forme lisible.
  • RIF : ici sont définies les règles devant créer les rapports d'importance.

Exemples pratiques

La toile sémantique se trouve encore à ses débuts. Toutefois, on constate surtout au niveau de l'extension des moteurs de recherche que ces derniers sont à présent vraiment capables de reconnaître l'importance des contenus.

Prenons pour exemple la recherche d'images de Google : elle est déjà en mesure de reconnaître des images similaires sur des fichiers déjà téléchargés. Le Knowledge Graph de Google est aussi un résultat de l'amélioration constante de la recherche sémantique. Il reconnaît par exemple quand utilisateur désire faire une comparaison.

En principe, dans l'extension du Web sémantique, il est aussi question d'un processus d'apprentissage. Plusieurs stratégies de la compagnie Google montrent comment atteindre ce progrès : grâce au Data Mining. En outre, les fonctions telles que l'historique Web des utilisateurs aident les moteurs de recherche à distinguer si un utilisateur recherche le « golf » en tant que sport ou plutôt la voiture lorsqu'il entre le mot homonyme dans la barre de recherche.

Liens web