Comprendre le web sémantique

Le Web sémantique permettra (contrairement au Web actuel qui est vu comme un Web syntaxique) de rendre de contenu sémantique des ressources Web interprétables non seulement par l'homme mais aussi par la machine.

5076

Article rédigé à partir du site www.cotechnoe.com

1. Le web sémantique en deux mots

… Le web

Depuis les années 1970, la mise en réseau des ordinateurs afin de permettre l’échange de donnée est une priorité de l’industrie. L’Ethernet est un protocole de premier niveau qui associe physiquement deux ou plusieurs ordinateurs. Au-dessus de l’Ethernet, l’Internet avec son protocole TCP/IP permet d’étendre et d’élargir la mise en réseau des ordinateurs au-delà du réseau local. Plusieurs applications de type client-serveur exploitent l’internet pour offrir des services aux utilisateurs. Par exemple: les applications pop3, MAPI, SMTP offrent des services d’échange de courrier par voix électronique; le service ftp (file transfer protocol) permet l’échange de fichiers entre ordinateurs. Il existe bien d’autres applications sur l’internet et celle qui attire plus spécifiquement notre attention est celle du web.

Le web est une application de l’Internet qui possède quelques caractéristiques :

  • il est une application de type client/serveur (un serveur fournit des données à traiter par un client localisé dans le réseau)
  • le client est la plupart du temps un fureteur web qui traite les donner afin de la présenter sous une forme intelligible à l’utilisateur (Internet Explorer, Firefox, Safari et Chrome sont quelques-un des fureteurs disponibles sur le web)
  • les données sont interopérables. L’interopérabilité est une notion fondamentale du web. Elle garantit qu’une donnée sur le web peut être traiter indépendamment de la technologie logicielle du serveur et/ou du client

… dont l’architecture gravite autour de trois composantes :

  • l’URL (Uniform Resource Locator) qui permet de localiser, avec une adresse unique, une ressource (une page, un fichier, un clip audio, etc) sur le web
  • le protocole HTTP (HyperText Transfer Protocol) est le langage de communication qui assure l’échange des données entre un serveur web et un client web (par exemple un fureteur web)
  • HTML (Hypertext Markup Language) est le langage de représentation des données sur le web. Il permet au fureteur de formater la donnée afin de la présenter de façon lisible à l’utilisateur

… la sémantique

La sémantique est la discipline de la linguistique qui étudie le signifiant (le sens) d’un énoncé. Dans le cadre du web sémantique, la sémantique sert à la description du contenu d’une page HTML. Elle exploite une pile de langages interopérables dont les principaux sont :

  • le RDF (Resource Description Framework) pour décrire une ressource
  • le RDFs (RDF Schema) pour décrire la structure des ressources
  • le OWL (Web Ontology Language) pour fournir une description avancée des ressources

La sémantique du web permet donc d’inter-relier les données du web selon leur signifiant qui se code dans un fichier particulier au web sémantique que l’on nomme ontologie.

L’ontologie  est le document au centre du web sémantique. Il permet de décrire les ressources du web, de cataloguer les ressources dans des classes et de décrire la ressource en lui attribuant des propriétés. À l’identique des requêtes SQL pour la base de données, le langage SPARQL permet de réaliser des requêtes dans l’ontologie.

Web sémantique = web + sémantique = web de données

En résumé, le web sémantique c’est une application de l’internet qui assure la diffusion de données interopérables sur le web. L’interopérabilité des données est garantie par l’ontologie qui est le document servant à entreposer la donnée et la codification du signifiant de cette donnée. De par ses caractéristiques, le web sémantique est en mesure d’offrir à ses utilisateurs de puissants outils de recherche et de raisonnement sur les données du web. Nous pouvons ainsi parler d’un véritable web de données.

2. Les usages du web sémantique

Le web sémantique n’est pas un choix technologique que l’on met en comparaison avec une autre technologie comme nous pouvons parfois le faire par exemple entre le Java et le C# ou encore entre Mac-Os ou Ms-Windows.

Le web sémantique et les technologies qui s’y rapportent, est la solution normalisée par le World Wide Web Consortium (W3C – l’organisme dont la mission est d’offrir des standards pour l’usage du Web) pour la diffusion et le traitement des données sur le web. Bien que d’autres organismes privés ou industriels proposent des solutions pour caractériser les données du web, seule la technologie du web sémantique normalisée par le W3C offre une solution entièrement interopérable, gratuite et non propriétaire. Voici donc quelques usages possibles qu’offre le web sémantique.

2.a. Méta-balise du contenu d’une page HTML pour en faciliter son indexation dans le web

En tant que détenteur d’un site web ou d’un blog, nous souhaitons tous que nos pages soient convenablement indexées par les moteurs de recherche (par ex.: Google, Bing, Yahoo, etc.). Lors de l’indexation de la page, le moteur d’indexation (aussi appelé robot) interprète le contenu de la page web pour en designer la signification. Par exemple, si le robot identifie souvent le nom « Michel Héon », il pourrait conclure qu’il s’agit de l’auteur de la page.

Il est possible d’indiquer de façon précise la signification d’un énoncé à un robot en y associant une méta-balise à une chaine de caractères (par ex. : .  <span property= »dc:creator »>Michel Héon</span>indiquant que « Michel Héon »  est le créateur). C’est avec le langage RDFa que la codification des métabalises est assurée dans le web sémantique.

2.b. Recherche intelligente de données

La recherche d’informations sur le web est la plus commune des usages du web sémantique. Les outils de recherche sur le web exploitent le web sémantique afin d’accélérer le processus de recherche et accroître la qualité de la pertinence des réponses produites. Pour chaque ressource du web, le robot de recherche extrait la donnée et il en déduit la signification en fonction du contexte de la donnée. Par exemple, une recherche sur « Vénus » retournera des réponses différentes selon que cette recherche soit réalisée dans le contexte de l’astronomie, de l’astrologie, des arts graphiques ou de la mythologie.  C’est par la signification (la sémantique)  associée  à la donnée que le robot de recherche associe la donnée au contexte.

2.c. Définition et normalisation de vocabulaires (métadonnées) sur le web

Dans une société de savoirs, la normalisation d’un vocabulaire devient un facteur crucial et facilitant des communications et des échanges d’informations et de connaissances entre les individus, les gouvernementales et l’industrie.

Codée dans une ontologie web sémantique le glossaire, le thesaurus, la taxonomie, voire même l’ontologie d’un domaine de connaissances, devient un fichier interopérable et indexable par une application web nécessiteuses des connaissances entreposées dans l’ontologie web sémantique.

2.d. Données ouvertes et liées (Linked Open Data LOD) sur le web

La réutilisation de la donnée et sa liaison avec d’autres données du web sont les enjeux principaux des données ouvertes et liées (LOD). Le LOD facilite ainsi la création de nouvelles connaissances fondées sur des connaissances déjà établies et partagées sur le web. Cinq principes( extraite des  cinq étoiles de Tim Berners Lee) guident la création de données ouvertes

* les données sont disponibles sur le web
* * les données sont structurées (par ex.: un fichier Excel au lieu d’un fichier mp3)
* * * diffuser les données dans un format non-propriétaire (par ex: le RDF au lieu fichier Excel)
* * * * Identifier les données par un URI ou une IRI
* * * * * lier vos données avec d’autres données du web afin de générer un contexte

2.e. Système expert, intelligence artificielle et raisonnement sur le web

Au cœur du web sémantique, l’ontologie est le fichier servant d’entrepôt de données. De part sa structure interne, l’ontologie se compare à la base de connaissances utilisée pour entreposer la connaissance d’un système expert. C’est donc dire qu’un système expert peut exploiter les données du web contenu dans les ontologies pour ainsi devenir un système expert web. Par exemple, chez les réseaux sociaux, l’ontologie de vocabulaire friend of a friend (FOAF) est largement utilisée. Les données sur les utilisateurs qui sont normalisées par FOAF servent de base de connaissances à un système expert dont le rôle est d’associer l’ami d’un ami à votre propre réseau de contacts. Ainsi, si Pierre est l’ami de Paul et que Paul est l’ami de Sophie alors le système expert proposera à Pierre de joindre Sophie à son réseau de contacts. Les systèmes ont de multiples fonctions, il peuvent associer des données, réaliser des recherches sur le web ou encore faciliter le processus d’aide à la prise de décision.

2.f. Intelligence d’affaires (BI) et système d’aide à la prise de décision

Dans nos sociétés hautement compétitives, la capacité de prendre la bonne décision au bon moment devient un enjeu pour le dirigeant souhaitant faire prospérer son organisation. La démarche de prise de décision comprend une phase d’analyse de la situation. Le rôle des systèmes d’intelligence d’affaires est de fournir sous la forme de tableau de bord, un recueil des informations au sujet d’une thématique précise. Les informations provenant du web peuvent jouer un rôle de premier plan dans le tableau de bord BI puisqu’elles sont le reflet des activités de la planète. C’est grâce aux technologies du web sémantique et des principes des données ouvertes et liées que les systèmes BI peuvent lire et interpréter les données du web.

Voici l’exemple d’un scénario de système BI faisant intervenir le web sémantique dans le contexte de la ville intelligente. Un entrepreneur en construction entreprend la construction d’un édifice. Avant de prendre la décision de creuser, l’entrepreneur doit s’assurer de la liberté de l’emplacement. Pour ce faire, il doit valider  de plusieurs points, soit: qu’aucune canalisation d’aqueduc ne traverse le terrain, qu’il ne s’agit pas d’un emplacement répertorié comme site historique, qu’aucune canalisation de gaz et qu’aucun conducteur électrique ou téléphonique ne traverse le terrain.  Dans le web des données ouvertes et liés de la ville intelligente, un système BI web sémantique pourra recueillir et centraliser les données nécessaires à l’alimentation du contenu du tableau de bord si la municipalité, les gouvernements, les entreprises fournisseuses de services (gaze, électricité, téléphonie, etc. ) fournissent sur le web les données désignant l’emplacement de leur infrastructure.  Publiées dans le format du web sémantique, ces données pourront être lues, partagées et analysées pour produire de nouvelles connaissances sur l’état de la ville.

3. Sécurité et web sémantique

À l’heure de la réalité d’un monde où l’ami d’un ami n’est pas nécessairement un ami, il importe de s’interroger sur l’application d’un certain contrôle de sécurité que nous souhaitons appliquer sur la donnée diffusée sur le web par l’intermédiaire du web sémantique. Après avoir convenablement ciblé les données à partager et détaillé les politiques d’exploitation de ces données, il importe d’implanter ces politiques dans le système d’informations. Étant avant tout une technologie issue du web, le web sémantique exploite les mêmes technologies et principes de sécurités que celles employées pour la diffusion de contenu web. Les notions d’intranetd’extranet, de pare-feu, de réseaux sécurisés VPN, de services par procuration (proxy) sont aussi exploitables dans le contexte du web sémantique. Ainsi, il est tout à fait possible d’ouvrir et lier des données avec le web sémantique à un réseau web restreint et sécurisé.

4. Ontologie et représentation des connaissances

En web sémantique, l’ontologie est le fichier qui sert à entreposer les données du système sémantique. Ainsi, en sémantique, le modèle de  données (l’ontologie) vise à représenter deux choses :

  • La donnée
  • La signification de la donnée

4.a. Définition d’ontologie

  • Aspect philosophique

L’ontologie est une branche de la philosophie traitant l’étude de l’être, de ses modalités et de ses propriétés.

« Bien que le terme trouve ses racines en philosophie, il est rentré dans le langage courant dans de nombreux domaines dès lors que des questions d’organisations de connaissances se posent »(extrait de wikipédia.fr 16-11-2015)

  • Aspect d’informatique cognitive

An ontology is a formal specification of a consensual conceptualization (Gruber 1993) “une ontologie est la spécification formelle d’une conceptualisation consensuelle

  • Aspect du web sémantique

L’ontologie est un fichier interopérable qui englobe la donnée et la codification de sa structure (Classe, Propriété, Individu)

4.b. L’ontologie en comparaison avec la base de données

4.c Représentation schématisée d’une ontologie

O = T-BOX + R-BOX + A-BOX

Une ontologie représentant un domaine (O)  qui englobe le contenu terminologique du domaine (T-BOX) avec l’ensemble des rôles associés au domaine (R-BOX) ainsi que l’ensemble des assertions (description des faits) associé au domaine (A-BOX). L’ontologie représente ainsi les deux niveaux d’abstraction d’un domaine de discours soit: le niveau conceptuel qui englobe les abstractions, les idées, les notions associés au domaine du discours (par ex.: Personne, Homme, etc.), soit: le niveau factuel qui englobe la description des faits observables du domaine du discours (par ex.: Pierre, Paul, Marie, etc.)

T-BOX

La T-BOX contient l’ensemble des classes servant à décrire le domaine et leur relation hiérarchique. Dans l’exemple, la T-BOX contient la déclaration de la classe Personne, de la classe Homme et de la classe Employé. De même, la T-BOX décrit la relation de subsomption (rdfs:subclassOf) entre EmployéHomme et entre Homme & Personne

R-BOX

La R-BOX contient la description des rôles permettant d’associer les éléments d’une classe aux éléments d’une autre classe. Dans l’exemple, il est déclaré dans le R-BOX que estUnEmployé est un rôle qui permet d’associer les individus de la classe Personne (rdfs:domain) aux individus de la classe Employé (rdfs:range)

A-BOX

La A-BOX décrit les assertions associées au domaine du discours. Dans l’exemple, l’individu Pierre est associé à l’individu Comptable par le prédicat estUnEmployé.  des rôles permettant d’associer les éléments d’une classe aux éléments d’une autre classe.

Merci à Michel Héon PhD, MScA, BSc et à Élisabeth Camus, MV, DO, Zoothérapeute

Article rédigé à partir du site www.cotechnoe.com

Sourcecotechnoe