Actualités
Agenda
Liens utiles
Netsource
Netsource - Sommaire en cours
Netsource - Anciens sommaires
Netsource - Recherche des archives
Revue Bases
Revue Bases - Sommaire en cours
Revue Bases - Anciens sommaires
Revue Bases - Recherche des archives
Ouvrages
Qui sommes-nous ?
Notre équipe
Accueil > Netsources > Anciens sommaires > Scirus (www.scirus.com), un moteur de recherche scientifique

Netsources, Numéro de Janvier-Février 2002 - n°36


Scirus (www.scirus.com), un moteur de recherche scientifique

Auteur : Madeleine Wolff-Terroine

 
Aux jeux olympiques de Search Engine Watch, si Google remporte la palme avec quatre médailles d’or, d’autres outils moins connus ont également été récompensés. Parmi eux, on remarque Scirus, élu “meilleur moteur de recherche spécialisé”.
   
Scirus (www.scirus.com) est en effet un moteur de recherche “vertical” qui n’explore que les domaines scientifiques, science étant pris dans son sens le plus large. Il est le résultat d’un partenariat entre Fast et Elsevier.
   
Fast est une société norvégienne bien connue pour son moteur de recherche  All the Web, qui se glorifie d’être l’un de ceux qui ont indexé le plus grand nombre de pages Web.
   
Elsevier quant à lui est l’un des plus grands éditeurs de revues scientifiques “peer-reviewed”.
   
Fast utilise la technologie de son moteur pour indexer tout ce qui est information scientifique sur Internet ; cela représente environ 69 millions de pages Web, parmi lesquelles : 40 millions proviennent des universités américaines ; 3,5 millions viennent des sites académiques anglais ; un million sont extraits de sites en .com et un million de sites en .org.
   
Fast reçoit les copies brutes des documents d’Elsevier, qui sont alors intégralement indexés. Ceci permet à Scirus d’intégrer les résultats de l’exploration du Web et ceux des collections privées, pour la plupart non-gratuites.
   
L’apport d’Elsevier dans la corbeille n’est en effet pas négligeable !

- 1,4 million de textes intégraux de Science Direct ;
- 200 500 textes intégraux de IDEAL (International Digital Electronic Access Library), provenant de 300 revues de Academic Science, Mosby… ;
- 1,9 million de résumés du Beilstein ;
- plus de 12 millions de citations de Medline ;
- 170 000 e-prints de E-Print ArXiv (cette initiative en physique, bien connue, fonctionne dans le cadre de l’OAI, Open Archive Initiative) ;
- 800 000 brevets du US Patent and Trade Mark Office ;
- 550 items de news de Neuroscion ;
- 370 articles intégraux de BioMed Central.
   
Scirus explore donc un énorme index provenant de la lecture aussi bien de pages html que de PostScript ou PDF.
   
Destiné à un public scientifique, habitué (du moins en théorie) à la consultation de banques de données, Scirus combine dans son mode de travail langage classique d’interrogation et facilités du Web.
   
Il offre donc trois niveaux d’interrogation : Basic, Advanced et Expert (réservé aux souscripteurs).
   
C’est sur la grille Basic que l’on débouche après avoir cliqué sur l’URL : un écran où il n’y a presque rien, en particulier – et il en sera partout ainsi – pas de publicité, cette plaie inévitable de trop nombreux sites Web.
   
On dispose donc d’une grande fenêtre pour écrire les termes de sa requête, et de critères additionnels : la recherche doit-elle se faire sur tous les termes, un des termes ou la phrase exacte ? L’interrogation doit-elle porter sur les sources Web ou les périodiques, et combien veut-on de documents par page à l’édition ?
   
Le mode Advanced, partant du même principe quant aux restrictions possibles sur les mots, permet l’utilisation des booléens AND, OR et AND NOT. La recherche peut se faire sur le titre de l’article, celui du journal, le nom de l’auteur, son lieu de travail, les mots clés, l’ISSN, l’URL et le domaine (28 domaines : des Sciences sociales et de l’Economie à la Médecine).
   
Le type d’information représente un autre critère : article de périodique, brevets, résumés, conférences… On peut aussi se limiter à certaines sources constituant le fonds exploré par Scirus : Beilstein, US Patent ou toutes les sources Web par exemple ; on peut enfin préciser  les années sur lesquelles doit porter la recherche et le nombre de documents par page.
   
Tous ces critères peuvent être sauvegardés. La liste des résultats indique le nombre total de documents et précise combien d’entre eux viennent du Web et combien des périodiques. Les résultats peuvent être classés par pertinence ou bien par date.
   
En même temps que la présentation des résultats, Scirus propose une liste importante de termes pouvant être utilisés pour affiner (refine) sa recherche ; nous dirions volontiers plutôt étendre ou changer l’orientation de l’interrogation.
   
Cette liste de termes est en effet obtenue par comptage statistique ; c’est dire qu’il y a un mélange de termes pouvant réellement être utiles et d’autres non seulement sans intérêt, mais qui ne peuvent qu’élargir totalement inutilement la sélection. Attention aux vertus des calculs statistiques. Ainsi, la recherche-test que nous avons faite sur phytohormone nous invite à affiner avec in vitro ou plant science !
   
Là encore, il n’est donc pas interdit d’appliquer son intelligence aux contributions de l’automatique.
   
Pour chaque référence, Scirus indique l’auteur, le titre, la source et quelques lignes suivies de “simular results”, comme ce que l’on voit avec Google. Si la référence provient d’un site Web ou de ressources gratuites, le lien se fait avec ce site. Et l’ensemble des opérations faites jusque-là est parfaitement libre et utilisable par tous.
   
En revanche, pour aller au-delà des quelques lignes fournies, sitôt qu’il s’agit d’articles de périodiques, il vous faut un mot de passe payant obtenu auprès de Science Direct d’Elsevier.
   
Si votre institution a une souscription auprès d’Elsevier pour sa presse imprimée, il est possible d’obtenir un mot de passe. L’intérêt en est d’obtenir les textes intégraux.
   
Scirus a donc de gros atouts pour tous ceux qui cherchent de l’information scientifique ; même si vous n’êtes pas souscripteurs auprès d’Elsevier, une recherche effectuée sur un sous-ensemble spécialisé du Web peut permettre d’identifier rapidement l’information désirée.
   
Pour des questions scientifiques, Scirus peut ainsi être plus pertinent que Google, car il exclut le plus possible les sites non scientifiques ; à une question sur Dolly, il identifiera la brebis clonée, quand Google trouvera “Dolly Parton”. Scirus trouvera par ailleurs des articles “peer-reviewed” provenant de bases de données validées et  explore les sites Web au-delà de leurs deux premiers niveaux. D’où son intérêt pour tous ceux qui veulent de l’information scientifique “sérieuse”.

 

Version imprimable
BASES PUBLICATIONS
27, rue de la Vistule
75013 Paris
Tél. : 01.45.82.75.75
contact@bases-publications.com
Abonnez-vous   |   Contact   |   Mentions légales |   Crédits