
|
Bases, Numéro de Novembre 2006 - n°232 Io-port.net : la littérature scientifique concernant l'informatiqueL’année 2006 a été celle de l’informatique en Allemagne. Cela n’est donc pas tout à fait une coïncidence si c’est justement au cours de cette année qu’a été lancé un portail dédié à l’informatique et, plus précisé-ment, à la littérature scientifique concernant le secteur. Ce portail a été développé par Fiz Karlsruhe en collaboration avec la Gesellschaft für Informatik, ainsi que les universités de Trier (Trèves) et Munich. On voit là une confirmation de la politique de Fiz Karlsruhe d’élargir ses activités au-delà de sa collaboration avec Chemical Abstracts Service, dans le cadre de STN International. ... |
Auteur : François Libmann |
|
Plus largement, cette initiative s’inscrit dans des projets initiés
et financés par le ministère allemand de l’Education et de la
Recherche (BMBF), qui visent à établir un réseau global permettant
aux chercheurs du monde entier de participer à des projets communs
et d’échanger des informations.
Il s’agit là, en particulier, de permettre aux chercheurs et aux étudiants allemands d’accéder aisément au savoir scientifique international dans le domaine de l’informatique. Ce portail a également bénéficié de l’utilisation d’outils sémantiques, qui sont les résultats d’un autre programme de recherche baptisé SeMIPort (Semantic Methods and tools for Information Portals), également financé par le même ministère. io-port.net – c’est le nom de ce portail – a été lancé au début de l’année 2006 dans sa version allemande, avec 2 millions de références issues de sources évaluées. La version anglaise pour sa part est disponible depuis juillet 2006. Les estimations récentes concernant le volume de références disponibles font état du chiffre de 2,5 millions. L’essentiel du contenu de io-port.net est constitué de l’agrégation de quatre bases de données : • DBLP – Digital Bibliography & Library Project de l’université de Trèves ; • CompuScience produite par Fiz Karlsruhe, également disponible sur STN mais dont la dernière mise à jour sur ce serveur date du 18 décembre 2002. Il ne faut d’ailleurs pas confondre CompuScience avec Compuab (Computer and information systems abstracts), produite par CSA, également disponible sur STN et qui continue quant à elle d’être mise à jour ; • Leabib (Bibliographical Database of the Lehrstuhl für Effizreiste Algorithmen of the Technical University of Münich) ; • CCSB (the Collection of Computer Science Bibliogra-phies, University of Karlsruhe). Le Web est par ailleurs crawlé régulièrement pour identifier des documents à intégrer, après validation, dans le portail et la Gesellschaft für Informatik, partenaire du projet, fournit également des documents qu’elle édite. Dans la majorité des références, un résumé est disponible, mais cela n’est pas pour autant systématique. Des mots-clés sont également proposés. Dans de nombreux cas, un lien est offert vers le document original sous forme électronique. Tous ne sont pas pour autant accessibles librement ; des inscriptions préalables à certains sites peuvent être nécessaires. On peut aussi faire appel au service Fiz Autodoc de fourniture des documents primaires. Au-delà de la recherche simple, la recherche avancée permet de combiner les opérateurs AND ou bien NOT avec jusqu’à cinq termes, chacun pouvant être dans un champ spécifique ou dans le basic index. On peut supposer que l’absence de l’opérateur OR est censée être compensée par la présence des outils sémantiques utilisés dans ce portail. Parmi ceux-ci, on peut noter le composant “Recommender”, qui permet de classer les résultats obtenus par pertinence. Cette pertinence est personnalisée en fonction du “contexte de travail” défini préalablement par l’utilisateur. Par ailleurs, le “Query Refinement” propose d’une part, dans une rubrique “modifications”, des termes de recherche analogues ou des synonymes et, d’autre part, dans une rubrique “specialisations”, des termes plus précis, ces derniers étant en général plus convaincants que les premiers. Ces possibilités ne sont pas proposées systématiquement. Après avoir lancé la recherche, on obtient d’abord une liste de titres et, d’un simple clic sur le titre, la référence complète. A partir d’une référence visualisée, on peut relancer la recherche sur le nom d’un des auteurs ou sur le nom de la source lorsqu’il s’agit d’une publication régulière, et obtenir ainsi respectivement les références des publications de cet auteur et les références des articles de la publication. Pour certaines références, des titres semblables de documents sont proposés. On atteint la référence correspondante d’un simple clic. Nous nous sommes assez naturellement posé la question du positionnement, de l’intérêt ou de la valeur ajoutée d’une telle banque de données, compte tenu de l’offre abondante disponible par ailleurs sur le sujet. Les possibilités sémantiques ne sont pas inintéressantes, sans paraître pour autant déterminantes, tout au moins au niveau de nos tests. Pour leur part, les serveurs tels que STN n’offrent pas d’outils sémantiques, mais mettent à disposition des utilisateurs des possibilités de recherche bien plus sophistiquées que celles proposées par io-port.net. On notera que Fiz Technik, qui est à la fois l’opérateur de io-port.net et l’un des acteurs importants de STN International, ne manque pas de présenter le portail dans sa brochure “A Focus of Information”, publiée à l’occasion de l’année de l’informatique, mais aussi de rappeler que de nombreuses banques de données disponibles sur STN ont des contenus liés à l’informatique. Il peut s’agir de banques de données dédiées pour une part significative à cette thématique, comme Inspec, ou de banques de données pluridisciplinaires comme Pascal, SCISearch ou Jicst-Eplus. On n’oubliera pas non plus Chemical Abstracts, Biosis, Medline ou Embase, qui référencent des documents concernant l’informatique appliquée à leur domaine de spécialité. Nous avons, pour notre part, effectué quelques tests en prenant des exemples simples. A la question Turing Test dans le titre, pour des documents publiés en 2005, on trouve quatre documents dans io-port.net. Dans Dialog, les banques de données SciSearch, Computer and Information Systems Abstracts, Inside Conference et Pascal donnent un total de six réponses, mais qui ne correspondent en fait qu’à deux documents différents, dont un se trouve également dans io-port.net. A une autre question, travelling salesman problem dans le titre, pour des documents publiés en 2006, io-port.net donne 23 réponses, dont une quinzaine se retrouvent également dans diverses bases de Dialog, notamment Inspec et Compendex. A l’inverse, sur la soixantaine de références trouvées dans Dialog, environ la moitié se trouvent dans io-port.net. On est donc fondé à dire, après ces tests rapides, que le recouvrement de contenu entre io-port.net et les bases relativement spécialisées sur les serveurs est loin d’être négligeable. Le contraire aurait été surprenant, car cela aurait signifié que les banques de données classiques étaient totalement passées à côté d’une partie de la littérature scientifique concernant l’informatique. On peut néanmoins estimer que la couverture de io-port.net concernant la littérature grise est sans doute meilleure, ce qui explique une partie de l’écart. Outre la différence de philosophie et de possibilités dans le mode d’interrogation, on voit apparaître là une nouvelle ressource, dont l’intérêt n’est pas à négliger pour les chercheurs en informatique. L’accès à io-port.net se fait sur une base forfaitaire annuelle, les prix variant de 1 900 € pour un campus universitaire ou 5 000 € pour une entreprise de plus de 500 salariés, à 125 € pour un utilisateur individuel. Il est toutefois possible d’effectuer librement une recherche simple, et de visualiser la liste des résultats qui indique, pour chacun, le titre, le nom de l’auteur et les références de la publication. INFORMATIONS : http://io-port.net Fachinformationszentrum Karlsruhe - Help Desk Postfach 2465 76012 Karlsruhe Tel.: (+49) 7247 808 555 Fax.: (+49) 7247 808 259 helpdesk@fiz-karlsruhe.de |
|