
|
Bases, Numéro de Novembre 2008 - n°254 La saison des chiffresPlusieurs producteurs/serveurs ont annoncé récemment avoir atteint des chiffres ronds significatifs, concernant le volume d’information qu’ils proposent.
|
Auteur : François Libmann |
|
Nous avons jugé utile de les regrouper, car cela donne des ordres
de grandeur intéressants, en l’occurrence dans le côté scientifique
et technique de l’industrie de l’information.
DERWENT WORLD PATENT AJOUTE PLUS D’UN MILLION D’INVENTIONS NOUVELLESThomson Scientific, le producteur de Derwent World Patents Index, a annoncé que, pour la première fois en 2008, le nombre d’inventions nouvelles (c’est à dire de familles de brevets) allait dépasser le million, pour atteindre vraisemblablement 1,24 millions à la fin de l’année. Le hasard fait bien les choses. En effet, la millionnième invention de 2008 est chinoise. C’est un brevet déposé par ZTE Communication Co Ltd, situé dans la province de Guangdong au sud de la Chine, et qui concerne l’amélioration des interfaces utilisateurs pour les téléphones cellulaires. Le fait qu’il s’agisse d’un brevet d’origine chinoise illustre la très forte croisssance annuelle des dépôts de brevets chinois, qui s’établit à 20% environ. La Chine est maintenant le troisième pays déposant, derrière le Japon et les Etats-Unis. La prise en compte, depuis juin 2007, des modèles d’utilité chinois, dont le nombre est sensiblement équivalent aux brevets, contribue évidemment à cette progression. HIGHWIRE PRESS A DEPASSE LES CINQ MILLIONS D’ARTICLESHighWire Press, un agrégateur “nouvelle vague” basé à l’université de Stanford et que nous avions présenté dans le n°211 (décembre 2004) de BASES, annonce avoir dépassé les cinq millions d’articles en ligne. Ce volume a été obtenu notamment par les chargements d’archives remontant au 19ème siècle de plusieurs publications, telles que JAMA (The Journal of the American Medical Association). Sur ces cinq millions d’articles en ligne, plus de deux millions sont en accès libre. L’ensemble provient de 140 éditeurs, lesquels publient 71 des 200 journaux les plus cités. Par ailleurs HighWire Press implante progressivement, journal par journal, sa nouvelle plateforme H20, qui est entièrement en XML. CAS ANNONCE L’ENREGISTREMENT DE SA QUARANTE MILLIONIEME STRUCTURELe 21 novembre dernier, le “CAS Registry Number” 1073662-18-6 a été attribué à un dérivé de l’azulen benzofurane. Cette quarante millionième structure à être enregistrée a été identifiée dans un article publié dans “Angewandte Chemie International Edition”. Cette substance est de nature à faciliter la synthèse de médicaments comme le Taxol, extrait de l’écorce de l’if utilisé en chimiothérapie. Outre les quarante millions de substances chimiques classiques, 60 millions de séquences d’acides nucléiques et de protéines sont également enregistrées. STN BIEN MODESTEDans le troisième numéro de STNews publié en 2008, STN fait preuve d’une rare modestie en annonçant que la banque de données Inspec, de l’Institution of Engineering and Technology (IET), vient d’incorporer son dix millionième document – en l’occurrence la référence d’un article sur les nanotechnologies –, en précisant que ces références remontent à 1969. Cette fière annonce est bien étrange puisqu’à fin décembre, INSPEC sur STN offre en réalité 11 187 622 documents, qui remontent à 1898 d’après la fiche technique – et en fait très légèrement avant pour près de 500 documents –, sachant que ce comptage à été réalisé avec les dates de publication. Si Inspec est, à l’évidence, une banque de données qui mérite d’être mise en avant, il y a peut-être d’autres façons d’en parler qu’en donnant une fausse information. Cette base bibliographique est spécialisée dans les domaines de la physique, de l’électronique et de l’informatique. Elle fait partie des grands classiques et dispose d’une indexation très sophistiquée. On notera qu’on y trouve des références concernant les sciences de l’information. Une rapide comparaison avec la banque de données Inspec disponible sur d’autres serveurs donne les résultats suivants : - sur Dialog, en additionnant les documents publiés chaque année, on arrive à un total de 11 175 606, très proche de celui de STN ; - sur DataStar, la couverture est la même et la commande DOCZ donne un total de 10 968 441 documents. On découvre au passage que 14 812 documents, inclus dans le chiffre précédent, n’ont pas de date de publication ; - sur Questel, la couverture officielle remonte à 1969 – en réalité un peu avant – et l’on trouve 10 332 820 documents, dont 15 779 sans date ; - sur STN et Dialog, il est plus difficile de repérer les documents sans date. Compte tenu de la taille de la base et son antériorité, il n’est ni toujours utile, ni toujours pratique de chercher sur l’ensemble de la base. Si Questel et STN ne permettent que de limiter les résultats d’une recherche par date, DataStar et Dialog proposent de multiples options pour n’interroger qu’une partie de la base : - sur DataStar, on a le choix entre plusieurs labels correspondant chacun à une période, INSP (depuis 1987), IN86 (1980-1986), IN79 (1969-1979), INYY (depuis 1969) IN68 (1898-1968), INZZ depuis 1898, c’est à dire l’ensemble de la base ; - sur Dialog, ce sont des numéros de fichiers différents : 2 pour la totalité, depuis 1898, 3 depuis 1969, 4 depuis 1983 et 202 de 1898 à 1968. On peut aussi, pour le fichier 4, entrer la commande BEGIN 4 Currentn ou n est compris entre 1 et 5 (la commande est mal interprétée si l’on met un chiffre supérieur à 5), pour limiter la recherche à la mise à jour de l’année en cours et des n années précédentes. Pour une recherche complexe, ce genre de commande est appréciable car elle limite significativement le temps de la recherche. |
|