
|
Netsources, Numéro de Novembre-Décembre 2006 - n°65 OpenDOAR.org recense et interroge plus de 830 dépôts d'archivesIl existe de par le monde de multiples dépôts d’archives en accès ouvert (open access repositories), mais il est difficile de les localiser et d’évaluer leur contenu. Le projet OpenDOAR a donc été lancé, à l’initiative des universités de Nottingham (Royaume-Uni) et de Lund (Suède), en collaboration avec l’OSI (Open Society Institute), le JISC (Joint Information Systems Committee), le CURL (Consortium of Research Libraries) et SPARC Europe, un regroupement de bibliothèques européennes. ...
|
Auteur : Béatrice Foenix-Riou |
|
Hébergé et maintenu par l’université de Nottingham, OpenDOAR est à
l’origine un répertoire international des dépôts d’archives en
accès ouvert et a comme vocation non de lister ces dépôts, mais
d’évaluer leur qualité et de choisir les plus utiles pour le monde
universitaire et celui de la recherche.
Près d’un quart des “candidatures” ne sont d’ailleurs pas acceptées, pour diverses raisons comme la présence de nombreux liens morts, des archives qui contiennent les métadonnées et non le document, un accès réservé, etc. Chaque site sélectionné est soigneusement testé par l’équipe éditoriale et fait l’objet d’une description détaillée. Une fiche fournit pour chaque dépôt le nom et les coordonnées de l’organisme gestionnaire, une description concise du contenu – avec la présence éventuelle d’e-alerts ou de flux RSS –, la date de création, le logiciel utilisé, le nombre de documents et la date de l’information, les domaines couverts, le type de documents proposés (publications, conférences, thèses, études...), la langue des documents et enfin les coordonnées du responsable. Plus de 830 dépôts sont recensés aujourd’hui ; la plupart sont institutionnels, mais on trouve aussi une grande variété de sites gouvernementaux et thématiques. La taille de ces dépôts d’archives ouvertes est très variable, de quelques dizaines de documents pour certains à plusieurs dizaines de milliers pour d’autres. La rubrique Search for repositories offre de multiples critères de recherche pour les localiser : recherche par mots sur la fiche descriptive et/ou classement des sites par domaines, par type de documents offerts, par pays, par langue... Plus de 29 dépôts sont ainsi localisés en France, parmi lesquels on citera : - ArchiMer : Institutional Archive of Ifremer (1 256 post-publications, conférences et thèses) ; - @rchiveSIC : Archive ouverte en sciences de l'information et de la communication (690 thèses, conférences, publications...) ; - Cither : Consultation en texte intégral des thèses en réseau (521 thèses) ; - COD : Crystallography Open Database (43 000 “datasets”) ; - Hal : Hyper article en ligne (37 000 articles, conférences, thèses...) ; - Persee : Périodiques scientifiques en édition électronique ; - Tel : Thèses en Ligne (5 211 thèses), etc. En ce qui concerne la langue des dépôts d’archives, une grande majorité est bien sûr en anglais (725, soit 87 %), mais on en trouve aussi en allemand (129, soit 15 %), en français (58, soit 7 %), en espagnol (44, soit 5 %), en suédois (29, soit 3 %), en italien (25, soit 3 %), etc. Quant aux secteurs couverts, la moitié environ des dépôts d’archives (49 %) sont multidisciplinaires, les autres se répartissent dans des domaines comme la santé et la médecine (8 %), l’informatique (9 %), l’histoire et l’archéologie (7 %), les sciences sociales (7 %), etc. Les résultats enfin peuvent être affichés dans différents formats. Le site propose par défaut un résumé de la fiche descriptive, mais on peut choisir de l’avoir dans son intégralité (une page par fiche), de lister les dépôts par leur nom, ou encore d’obtenir les résultats sous la forme d’un tableau. Celui-ci indique alors, pour chaque dépôt et dans des colonnes successives : le nom, le pays, le nombre de documents, le nom du logiciel et la présence éventuelle de publications, de conférences, de thèses ou de documents non publiés. Avec ce répertoire qualifié de dépôts d’archives ouvertes, OpenDOAR méritait déjà de figurer dans les signets des chercheurs et universitaires. On notera d’ailleurs que lors du congrès 2006 de l’IFLA (International Federation of Library Associations), les résultats d’une étude comparative sur 24 annuaires de dépôts d’archives ouvertes ont été présentés et citaient l’OpenDOAR comme le “leader” du domaine*. L’étape qu’il vient de franchir ne peut que conforter cette position... LA RECHERCHE SUR LE CONTENU DES DEPOTSLe site OpenDOAR s’est en effet enrichi depuis peu du module Search repository contents, qui permet de lancer une recherche non plus sur le répertoire des dépôts d’archives, mais sur le contenu de ces dépôts. Ce module utilise en fait le service Google Custom Search Engine (Google CSE), lancé par Google en octobre 2006, et qui permet de créer gratuitement – sur son site ou sur une page hébergée par Google – son propre moteur de recherche, interrogeant des sources préalablement choisies. L’université de Nottingham a bien vu l’intérêt d’un tel outil et l’a utilisé pour permettre aux internautes de lancer une recherche sur le contenu des divers dépôts recensés. Il faut toutefois garder en mémoire que le fonctionnement de Google CSE est basé non sur l’interrogation directe des dépôts d’archives, mais sur l’interrogation de l’index de Google, en limitant la recherche aux sites qui ont été préalablement indiqués. Cela revient en quelque sorte à lancer une recherche sur le moteur Google, en ajoutant à sa requête une commande telle que site:ifremer.fr/docelec/ OR site:..., avec l’ensemble des noms de domaine des archives. Par conséquent, si cette application permet certes de lancer très simplement une requête qu’il serait impossible de formuler manuellement, la recherche est limitée aux pages des dépôts d’archives indexées par Google. Or, le moteur n’indexe pas forcément toutes les pages de tous les dépôts, ni les plus récentes... Un dépôt d’archive qui ne proposera par exemple qu’une seule recherche par mots via un formulaire ne pourra être indexé par Google (il appartiendra au “Web invisible”), et l’on ne pourra donc retrouver les résultats via le moteur de l’OpenDOAR. D’autre part, les possibilités de recherche sont celles offertes par Google, et sont infiniment moins sophistiquées que celles disponibles sur certains dépôts d’archives ; certains dépôts proposent en effet de restreindre la requête selon au nom du laboratoire, de l’équipe de recherche, des collaborations... Sur OpenDOAR, le module Search repository contents (en phase d’essai) offre en fait une grille de recherche très basique, limitée à une simple zone de saisie. Aucune grille de recherche avancée n’est proposée, mais nos tests montrent que les opérateurs intitle:, inurl:, filetype: et site: fonctionnent toutefois (ils permettent de restreindre respectivement la recherche aux titres des pages, à leur URL, à certains formats de documents (PDF, doc...) ou encore à certains sites spécifiques). La page de résultats indique, classiquement, le titre du document, un extrait pertinent et l’URL ; comme sur le Web, un lien “Similar pages” est proposé. Bizarrement, le nombre de résultats obtenus n’est pas indiqué. Le site affiche par défaut 10 résultats par page. On regrettera que, contrairement à des services comme Google Scholar notamment, il soit impossible ici de restreindre la recherche selon la date de publication des documents. La seule possibilité est de préciser une ou plusieurs années dans sa requête (par exemple : “invisible web” 2006 OR 2005.) Cela étant et malgré ces faiblesses, l’OpenDOAR vient ici d’apporter une réelle valeur ajoutée à son site et l’on ne peut que s’en réjouir. Cet outil vient compléter parfaitement DOAJ.org (Directory of Open Access Journals), qui recense pour sa part plus de 2 500 publications en accès libre et permet également de lancer une recherche sur leur contenu (voir Netsources n°51). * Directories of Institutional Repositories: Research Results & Recommendations http://www.ifla.org/IV/ifla72/papers/151-Oliver_Swain-en.pdf. |
|