Actualités
Agenda
Liens utiles
Netsource
Netsource - Sommaire en cours
Netsource - Anciens sommaires
Netsource - Recherche des archives
Revue Bases
Revue Bases - Sommaire en cours
Revue Bases - Anciens sommaires
Revue Bases - Recherche des archives
Ouvrages
Qui sommes-nous ?
Notre équipe
Accueil > Bases > La saison des chiffres

Bases, Numéro de Novembre 2008 - n°254


La saison des chiffres

Plusieurs producteurs/serveurs ont annoncé récemment avoir atteint des chiffres ronds significatifs, concernant le volume d’information qu’ils proposent.
(...)

Auteur : François Libmann

 
Nous avons jugé utile de les regrouper, car cela donne des ordres de grandeur intéressants, en l’occurrence dans le côté scientifique et technique de l’industrie de l’information.
   

DERWENT WORLD PATENT AJOUTE PLUS D’UN MILLION D’INVENTIONS NOUVELLES

   
Thomson Scientific, le producteur de Derwent World Patents Index, a annoncé que, pour la première fois en 2008, le nombre d’inventions nouvelles (c’est à dire de familles de brevets) allait dépasser le million, pour atteindre vraisemblablement 1,24 millions à la fin de l’année.
   
Le hasard fait bien les choses. En effet, la millionnième invention de 2008 est chinoise. C’est un brevet déposé par ZTE Communication Co Ltd, situé dans la province de Guangdong au sud de la Chine, et qui concerne l’amélioration des interfaces utilisateurs pour les téléphones cellulaires.
   
Le fait qu’il s’agisse d’un brevet d’origine chinoise illustre la très forte croisssance annuelle des dépôts de brevets chinois, qui s’établit à 20% environ.

La Chine est maintenant le troisième pays déposant, derrière le Japon et les Etats-Unis.
   
La prise en compte, depuis juin 2007, des modèles d’utilité chinois, dont le nombre est sensiblement équivalent aux brevets, contribue évidemment à cette progression.
   

HIGHWIRE PRESS A DEPASSE LES CINQ MILLIONS D’ARTICLES

   
HighWire Press, un agrégateur “nouvelle vague” basé à l’université de Stanford et que nous avions présenté dans le n°211 (décembre 2004) de BASES, annonce avoir dépassé les cinq millions d’articles en ligne.
   
Ce volume a été obtenu notamment par les chargements d’archives remontant au 19ème siècle de plusieurs publications, telles que JAMA (The Journal of the American Medical Association). Sur ces cinq millions d’articles en ligne, plus de deux millions sont en accès libre. L’ensemble provient de 140 éditeurs, lesquels publient 71 des 200 journaux les plus cités.
   
Par ailleurs HighWire Press implante progressivement, journal par journal, sa nouvelle plateforme H20, qui est entièrement en XML.
   

CAS ANNONCE L’ENREGISTREMENT DE SA QUARANTE MILLIONIEME STRUCTURE

   
Le 21 novembre dernier, le “CAS Registry Number” 1073662-18-6 a été attribué à un dérivé de l’azulen benzofurane. Cette quarante millionième structure à être enregistrée a été identifiée dans un article publié dans “Angewandte Chemie International Edition”.
   
Cette substance est de nature à faciliter la synthèse de médicaments comme le Taxol, extrait de l’écorce de l’if utilisé en chimiothérapie.
   
Outre les quarante millions de substances chimiques classiques, 60 millions de séquences d’acides nucléiques et de protéines sont également enregistrées.
   

STN BIEN MODESTE

   
Dans le troisième numéro de STNews publié en 2008, STN fait preuve d’une rare modestie en annonçant que la banque de données Inspec, de l’Institution of Engineering and Technology (IET), vient d’incorporer son dix millionième document – en l’occurrence la référence d’un article sur les nanotechnologies –, en précisant que ces références remontent à 1969.
   
Cette fière annonce est bien étrange puisqu’à fin décembre, INSPEC sur STN offre en réalité 11 187 622 documents, qui remontent à 1898 d’après la fiche technique – et en fait très légèrement avant pour près de 500 documents –, sachant que ce comptage à été réalisé avec les dates de publication.
   
Si Inspec est, à l’évidence, une banque de données qui mérite d’être mise en avant, il y a peut-être d’autres façons d’en parler qu’en donnant une fausse information. Cette base bibliographique est spécialisée dans les domaines de la physique, de l’électronique et de l’informatique. Elle fait partie des grands  classiques et dispose d’une indexation très sophistiquée. On notera qu’on y trouve des références concernant les sciences de l’information.
   
Une rapide comparaison avec la banque de données Inspec disponible sur d’autres serveurs donne les résultats suivants :

-  sur Dialog, en additionnant les documents publiés chaque  année, on arrive à un total de 11 175 606, très proche de celui de STN ;
-  sur DataStar, la couverture est la même et la commande DOCZ donne un total de 10 968 441 documents.
On découvre au passage que 14 812 documents, inclus dans le chiffre précédent, n’ont pas de date de publication ;
-  sur Questel, la couverture officielle remonte à 1969 – en réalité un peu avant – et l’on trouve 10 332 820 documents, dont 15 779 sans date ;
-  sur STN et Dialog, il est plus difficile de repérer les documents sans date.
   
Compte tenu de la taille de la base et son antériorité, il n’est ni toujours utile, ni toujours pratique de chercher sur l’ensemble de la base.
   
Si Questel et STN ne permettent que de limiter les résultats d’une recherche par date, DataStar et Dialog proposent de multiples options pour n’interroger qu’une partie de la base :

-  sur DataStar, on a le choix entre plusieurs labels correspondant chacun à une période, INSP (depuis 1987), IN86 (1980-1986), IN79 (1969-1979), INYY (depuis 1969) IN68 (1898-1968), INZZ depuis 1898, c’est à dire l’ensemble de la base ;
-  sur Dialog, ce sont des numéros de fichiers différents : 2 pour la totalité, depuis 1898, 3 depuis 1969, 4 depuis 1983 et 202 de 1898 à 1968.
   
On peut aussi, pour le fichier 4, entrer la commande BEGIN 4 Currentn ou n est compris entre 1 et 5 (la commande est mal interprétée si l’on met un chiffre supérieur à 5), pour limiter la recherche à la mise à jour de l’année en cours et des n années précédentes.
   
Pour une recherche complexe, ce genre de commande est appréciable car elle limite significativement le temps de la recherche.


 

Version imprimable
BASES PUBLICATIONS
27, rue de la Vistule
75013 Paris
Tél. : 01.45.82.75.75
contact@bases-publications.com
Abonnez-vous   |   Contact   |   Mentions légales |   Crédits