à lire... • Le Web sémantique en bibliothèque

// à lire... • Le Web sémantique en bibliothèque

Date : 2015-03-25 15:08:56


Le Web sémantique en bibliothèque


Le Web est un formidable espace de données sans frontières et interopérable. Malheureusement, il ne peut accéder à des données structurées contenues dans des bases, tels que nos catalogues. C’est pour les sortir du « Web profond » qu’un groupe, le W3C (Word Wide Web Consortium), travaille à l’élaboration d’un ensemble de données et de normes qu’on appelle le Web sémantique.
Conçu sous la forme d’un manuel, l’ouvrage d’Emmanuelle Bermès nous plonge au cœur de ces technologies de manière théorique et pratique, et apporte les informations essentielles à la construction d’un projet.


Si les missions d’une bibliothèque évoluent, c’est parce que le monde bouge. L’objectif premier du Web sémantique est de répondre à ces changements. Le public s’est élargi et consomme différemment. Partant des besoins des usagers, il est nécessaire de repenser les outils et les fonctions des bibliothèques dans un contexte d’utilisation différent et de réconcilier les normes des bibliothèques avec celles du Web. En intégrant les bibliothèques et leurs ressources dans l’architecture du Web, l’idée est de les positionner sur le parcours de l’internaute, de les rendre visibles. Bien sûr, on peut s’appuyer sur les réseaux sociaux ou un bon référencement, mais cela ne suffit pas. L’usager veut un accès immédiat aux contenus. Pour cela, la solution consiste à développer une structure globale basée sur des relations entre des ressources : c’est le modèle proposé par RDF qui sous-tend le Web sémantique.

L’investissement des bibliothèques dans la définition et la normalisation des formats informatiques pour le stockage, l’échange et la manipulation des données n’est plus à démontrer, mais les schémas développés jusqu’ici sont devenus obsolètes. Bien sûr, des évolutions sont en cours – réflexion sur de nouveaux modèles (FRBR) et de nouvelles règles de catalogage (RDA), utilisation du protocole OAI-PMH, etc. Mais il faut aller plus loin. En effet, ces évolutions sont trop limitées (requêtes basiques, temps de réponse inadapté) et ne correspondent plus à l’utilisation du Web.

Pour entrer de plain-pied dans le Web, il faut faire converger nos données sans qu’elles soient réduites au plus petit dénominateur commun (perte de qualité). Il convient donc de repenser l’interopérabilité, de la fonder sur des liens, basés sur les URI, en utilisant et en combinant différentes stratégies sans négliger l’importance des référentiels. Le principe de ce nouveau modèle repose sur un système de référence universel qui sépare la structure (modèle de triplet) de la sémantique (nature des choses et relations qu’elles entretiennent). Son objectif est de rendre cette sémantique manipulable par les machines pour qu’elle devienne exploitable dans le contexte de l’architecture du Web et permette ainsi d’ouvrir la porte à de nouveaux usages.

À la lecture, parfois ardue, de cet ouvrage, on comprend que le Web de données constitue un véritable enjeu pour nos bibliothèques. En adoptant ces technologies et ces normes, il est possible de s’intégrer totalement à l’environnement du Web. Encore faut-il que ces principes soient adoptés par les acteurs du Web eux-mêmes. De ce côté les signes sont encourageants. Malgré tout, il faut garder en mémoire que la technologie constitue juste un moyen et qu’il reste indispensable de définir comment, à quelles fins et suivant quelles méthodes, ces technologies du Web sémantique peuvent être mises en œuvre dans le contexte de nos établissements.

Au-delà du fait de réinventer la bibliothèque et son catalogue, ces technologies répondent à un questionnement plus global : quel rôle et quelles missions pour la bibliothèque aujourd’hui ?

+++
Le Web sémantique
en bibliothèque


Publier : la publication des données en RDF ne remet pas en cause la production de données et ses outils, mais constitue un format de sortie différent permettant la réutilisation des données par d’autres.
Consommer : réutiliser, agréger des sources extérieures pour créer de nouveaux services, enrichir son site Web ou son catalogue.
Lier : mettre en place le Web sémantique à l’intérieur de la bibliothèque qui gère plusieurs logiciels métiers différents et plusieurs bases de données. C’est le principe du LED qui améliore la gestion de l’information et permet de rendre un service plus cohérent pour l’usager.

+++
Lexique


FRBR : modélisation conceptuelle de l’information contenue dans une notice bibliographique.
LED : utilisation des principes du Web de données à l’intérieur du système d’information d’un même organisme.
OAI-PMH : permet d’exposer des données dans un entrepôt interrogeable avec le protocole « http ».
RDA : nouvelles règles de catalogage basées sur la modélisation définie par FRBR et compatibles avec les standards du Web.
RDF : modèle d’organisation théorique et logique de l’information.
URI : système d’identifiants dont la syntaxe est normalisée.
URL : URI particulière qui utilise le schème « http ».


• Anne Bouchard

Emmanuelle Bermès, Le Web sémantique
en bibliothèque
, Le Cercle de la Librairie, 2013