Actualités
Agenda
Liens utiles
Netsource
Netsource - Sommaire en cours
Netsource - Anciens sommaires
Netsource - Recherche des archives
Revue Bases
Revue Bases - Sommaire en cours
Revue Bases - Anciens sommaires
Revue Bases - Recherche des archives
Ouvrages
Qui sommes-nous ?
Notre équipe
Accueil > Bases > Culture.fr : le patrimoine français à portée de clics

Bases, Numéro de septembre 2008 - n°252


Culture.fr : le patrimoine français à portée de clics

Lancé en octobre 2003 pour favoriser l’accès à la culture sur le Web, le portail Culture.fr est une véritable mine d’information sur le patrimoine français.(...)

Auteur : Carole Barthole

 
Développé par le ministère de la Culture et de la Communication, il donne accès à de multiples informations : événements culturels en France, recensement des musées et bibliothèques, recensement des nombreuses collections disponibles sur le sol français… 

Dans cet article, nous nous intéresserons plus spécifiquement au moteur de recherche sémantique disponible sur le portail, qui offre des fonctionnalités puissantes, permettant de rechercher des œuvres et documents patrimoniaux.
   

PLUS DE 3 MILLIONS DE NOTICES ET 2 MILLIONS D’IMAGES DISPONIBLES

   
Lancé récemment, le moteur de recherche sémantique a été développé par la société Sinequa et utilise la technologie Intuition. On y accède à partir de l’onglet “Collections” disponible en haut de la page d’accueil du portail.
   
Il recherche actuellement dans 30 sources contenant plus de trois millions de notices et deux millions d’images de données patrimoniales.
   
Les œuvres et documents présentés sont souvent détenus par des institutions, musées, monuments historiques, bibliothèques et services d'archives répartis sur l’ensemble du territoire français.
   
Les documents proviennent aussi bien de bases de données, de sites web que de publications électroniques. Et les domaines couverts sont là aussi très vastes : architecture, archéologie, peinture, plans,  sculpture, archives, photos pour n’en citer que quelques-uns.
   
Le moteur est disponible en trois langues – français, anglais et espagnol –, mais la recherche doit se faire exclusivement en français, car les notices bibliographiques sont toutes en langue française.
   
L’outil propose une recherche intuitive bien loin de la syntaxe des moteurs de recherche traditionnels comme Google ou Yahoo!.
   
Il procède en effet à une analyse morpho-syntaxique des mots de la requête, afin de retrouver leurs variantes et termes associés ; il effectue automatiquement des corrections phonétiques et orthographiques et intègre l’analyse sémantique. Il est par exemple possible d’entrer des requêtes naturelles comme “la peinture flamande au 18e siècle” et de retrouver des notices contenant les termes peintures, flandres, toile, tableau, XVIIIe siècle, etc.
   

LA SEMANTIQUE AU SERVICE DE LA RECHERCHE

   
Depuis la page d’accueil du module Collections, seule une recherche simple, en “texte libre”, est disponible.
   
On peut toutefois restreindre la sélection aux notices contenant des images.
   
Une fois la requête lancée, les résultats apparaissent classés par défaut par liste, mais on peut choisir un affichage par catégorie ou en mosaïque.
   
Pour chaque résultat, on dispose de son image, du titre et d’un extrait de la notice.
   
A droite de chaque résultat, un symbole permet d’afficher une notice abrégée pouvant indiquer le domaine, le titre, l’auteur, l’école, etc.
   
Sur la partie gauche de la liste, une colonne offre plusieurs filtres permettant d’affiner la sélection au travers de plusieurs rubriques : termes associés, qui, quand, où et catégories (notices d’œuvres, visites virtuelles ou notices d’événement par exemple).
   
A droite de la zone de saisie, un lien Recherche avancée affiche une grille permettant l’utilisation d’opérateurs booléens (tous les mots saisis, au moins un des mots saisis...) et même d’opérateurs de proximité (tous les mots dans la même phrase et tous les mots côte à côte), ce qui est très rare pour un moteur de recherche en accès libre. Mais les fonctionnalités vont aussi beaucoup plus loin : on peut choisir d’appliquer ou non la recherche sur la forme exacte des mots, d’utiliser la correction orthographique et/ou d’élargir la requête aux termes proches.
   
On peut enfin restreindre la recherche à certaines dates ou périodes. Et là, il existe trois manières de procéder. On peut inscrire sa date ou période en texte libre – en entrant par exemple “Renaissance” ou “15e siècle” –, on peut aussi entrer un intervalle de date ou une année précise.
   
A cela s’ajoute une petite touche très Web 2.0, puisque le moteur offre la possibilité de s’abonner au résultat de sa requête par flux RSS.
   
On apprécie donc beaucoup les capacités et les fonctionnalités de recherche proposées par le moteur, d’autant plus que les résultats sont tout à fait pertinents.
   
On regrettera néanmoins l’impossibilité de pouvoir accéder, dès la page d’accueil, à la recherche avancée. Il est aussi dommage que les notices ne soient pas traduites dans différentes langues (au minimum l’anglais). Mais l’on peut penser que la première étape est celle du chargement des bases de données patrimoniales...
   
Dans le classement des Sites par thèmes du module Collections on trouve, sous la rubrique “Sources documentaires intégrées dans Collections”, une rubrique “Sources documentaires prochainement intégrées” qui annonce notamment, parmi les prochains chargements, celui de Gallica (70 000 ouvrages numérisés, 80 000 images...) et du PhoCEM (Musée des civilisations de l'Europe et de la Méditerranée, contenant 174 090 notices et 39 000 images).
   
Une troisième liste, intitulée “Autres sources documentaires”, 
recense de nombreuses banques de données fort intéressantes – avec un lien direct vers elles –, et laisse espérer que leur contenu viendra ultérieurement s’ajouter à celui du module Collections.
   
www.culture.fr
   


 

Version imprimable
BASES PUBLICATIONS
27, rue de la Vistule
75013 Paris
Tél. : 01.45.82.75.75
contact@bases-publications.com
Abonnez-vous   |   Contact   |   Mentions légales |   Crédits