Il arrive parfois que l’on ait à effectuer une recherche
d’informations sur des périodes anciennes.
La mise à disposition d’archives papier a évidemment été réalisée
bien avant l’avènement de l’information électronique.
Nombre de ces dernières sont à la disposition des chercheurs, avec
parfois des antériorités très grandes ; mais les recherches dans
ces fonds riches et variés ne se font pas à distance et prennent
facilement un temps important.
On a vu en particulier se développer une offre assez riche de
cédéroms ou de produits en ligne sur Internet, disponibles
uniquement dans le cadre d’un abonnement annuel. Mais sauf à
appartenir à une organisation qui a souscrit à de tels produits, ou
à pouvoir se déplacer dans une bibliothèque qui y donne accès, le
documentaliste qui souhaite occasionnellement trouver rapidement en
ligne un article ancien dispose d’un champ de possibilités beaucoup
plus restreint.
C’est à lui que nous nous intéresserons dans cet article – à celui
qui interroge des banques de données en ligne –, en limitant notre
investigation au domaine de la presse généraliste ou
technico-économique.
On rappellera néanmoins que dans le domaine de l’information en
ligne, les références d’articles de type scientifique remontent
souvent aux années soixante. Chemical Abstracts pour sa part a une
politique délibérée de remontée dans le temps, puisque les
documents les plus anciens disponibles aujourd’hui sur STN datent
de 1907 – 600 d’entre eux font même figurent d’exception et
sont antérieurs à cette date. Il faut préciser que cette remontée
dans le temps, un peu atypique dans le domaine scientifique, est
particulière au secteur de la chimie, dans lequel des informations
très anciennes peuvent garder une grande valeur.
DataStar vient par ailleurs de mettre en ligne OldMedline (ME65,
qui est aussi une partie de MEZZ, l’ensemble du fichier) ; cette
base couvre la période 1951-1965, sachant que les références sont
moins complètes que celles de périodes plus récentes.
On trouvera dans le tableau ci-contre quelques exemples
d’antériorité de banques de données de type scientifique et
technique.
LES BANQUES DE DONNEES BIBLIOGRAPHIQUES
Dans le domaine de la presse généraliste ou technico-économique, on
a vu apparaître quelques bases bibliographiques avec des citations
et quelquefois des résumés.
La plus célèbre est Promt, qui a démarré en 1972. On trouve
aujourd’hui sur Dialog (fichier 160) la partie la plus ancienne de
cette base (1972-1989), alors que l’antériorité n’est que de 1978
sur STN et de 1982 sur DataStar. Quant à LexisNexis, les plus
anciens documents issus de Promt remontent au début 1995.
On signalera aussi :
- ABI/Inform, plus orientée sur le management, qui remonte à 1971
sur Dialog, avec 1 732 références avec résumés de documents publiés
cette année-là. On a vu par ailleurs arriver le texte intégral de
certains documents à partir de 1992.
- Chemical Industry Notes, démarre en 1974 ; ses résumés ne sont
disponibles que sur STN et pas sur Dialog, comme c’est le cas pour
la base Chemical Abstracts, du même producteur ;
- on signalera enfin le contenu de Textline, l’ancêtre de Reuters
Business Briefing, inclus maintenant dans Factiva et qui démarre
début 1980.
Malheureusement, le titre indiqué pour tous les articles ou résumés
d’articles est invariablement “Textline Multiple Sources Collection
(1980-1994)”. Le nom des publications dont sont tirées les
informations n’apparaît quant à lui qu’en abrégé.
Si certains sont évidents – comme FT pour Financial Times –, il
faudrait, pour d’autres, avoir sous la main la documentation que le
producteur de Textline n’avait pas manqué d’éditer en son
temps...
Les banques de données Isis et Grappe – banques de données
françaises de même nature que Promt – ont démarré elles aussi à
cette époque. Grappe a été lancée en novembre 1979, sur
feu le serveur SG2 Citere, puis à partir d’octobre 1983 sur
Télésystemes Questel. Isis quant à elle a démarré en janvier 1981
sur G.Cam serveur.
Elles ont finalement – et cela aurait dû être fait bien plus tôt –
fusionné en décembre 1987 pour donner naissance à Delphes,
disponible aujourd’hui sur de nombreux serveurs.
Hélàs, seules les cinq dernières années de cette banque de données,
plus l’année en cours – c’est-à-dire aujourd’hui depuis 1999 – sont
disponibles sur les serveurs. Il est vrai que la partie la plus
ancienne était peu interrogée ; c’est la raison qui a dicté
ce choix.
Les archives ne sont plus accessibles que sur un cédérom diffusé
par la société Indexpresse, pour la période 1980-1996 ; le cédérom
couvrant la période 1980-1998 devrait être très prochainement
disponible.
Signalons, en le regrettant également, que la Chambre de Commerce
et d’Industrie de Paris ne garantit pas la fourniture de documents
primaires, pour les documents qui ne sont plus en ligne.
ANTERIORITE DE QUELQUES BASES BIBLIOGRAPHIQUES DU DOMAINE
SCIENTIFIQUE OU BREVET
|
Medline (biomédical) |
1951
sur DataStar |
| Sport
Discus (sport) |
1962 |
|
Derwent World Patents Index (brevets) |
1963 |
|
American History and Life (histoire) |
1963 |
| NTIS
(multidisciplinaire) |
1964 |
|
Brevets français |
1966
(1961 pour les brevets spéciaux de médicaments) |
| Eric
(pédagogie) |
1966 |
|
Weldasearch (soudure) |
1966 |
|
World Textile (textile) |
1968
|
|
Biosis Preview (biologie) |
1969 |
|
Inspec (électronique) |
1969 |
| EI
Compendex (ingénierie) |
1970 |
|
Agricola (agriculture) |
1970 |
|
Tris (transport) |
1970 |
LA PRESSE SUR LES AGREGATEURS
Pour les titres de presse générale ou économique dont le texte
intégral est en ligne, nous avons voulu faire le tour de ce qui
était disponible sur les serveurs agrégateurs.En fait, deux
serveurs ont clairement une politique de mise à disposition
d’archives ancien-nes ; il s’agit de L’Européenne de données pour
la France et de LexisNexis au niveau international.
On trouve en effet sur L’Européenne de Données la totalité des
archives du service documentaire de l’AFP (AFP Doc) depuis ...
1951, ce fichier reprenant une sélection de dépêches considérées
comme documents de fond. Les plus anciennes dépêches publiées en
1951 sont au nombre de quatre et présentent la biographie de Pétain
puis, en 1953, quatre dépêches reprennent la biographie de Staline.
Ensuite, jusqu’aux années 80, il y a quelques dizaines de dépêches
par an, qui sont essentiellement des panoramas de l’année. A partir
de 1981 – avec néanmoins un creux de 1984 à 1987 –, on trouve entre
2 000 et 4 000 documents par an.
Petite astuce d’interrogation : le choix de date le plus ancien
dans l’écran de recherche étant 1973, il faut passer par l’option
Personnalisée dans la fenêtre Période pour accéder aux documents
antérieurs à 1973.
L’autre source ayant une grande antériorité est Le Monde
Diplomatique, en cours de chargement, dont les archives remontent
au 1er janvier 1973.
Si l’on se rapproche de la période actuelle, on notera que le fil
général de l’AFP est disponible depuis le 7 juillet 1983 et le fil
économique depuis le 1er août 1983, les autres serveurs n’ayant que
des dépêches plus récentes (1991 ou 1992 pour DataStar, 2001 pour
Europresse).
En matière de presse quotidienne, le titre ayant la plus grande
antériorité est Le Monde ; ses archives sur L’Européenne de Données
– comme sur la plupart des autres serveurs – remontent au début
1987.
Ce n’est ensuite que dans les années 1990 (2 février 1990 pour
L’Humanité, 1er mars pour La Tribune, puis 5 janvier 1991 pour Les
Echos, 2 janvier 1995 pour Libération...) que le mouvement de mise
en ligne a commencé à se développer et, plus récemment encore – fin
des années 90/début des années 2000 – qu’il a pris de
l’ampleur.
Si l’on se tourne vers la presse internationale, c’est
incontestablement le serveur LexisNexis qui a l’offre la plus riche
de différents titres quotidiens ou non, dont l’antériorité remonte
aux années 1970, comme on le verra dans le tableau ci-dessous.
Signalons que le texte intégral du Financial Times n’est disponible
“que” depuis 1982, comme sur Dialog et DataStar.
Sur Dialog, mis à part Promt et ABI/Inform signalées plus haut et
qui proposent des références à une sélection d’articles d’un grand
nombre de publications, on trouve les résumés du New York Times
depuis début 1969 et ceux du Wall Street Journal depuis le 1er mai
1973, comme sur LexisNexis. Curieusement sur Factiva, ces résumés
ne sont disponibles qu’à partir du 13 juin 1979, les articles en
texte intégral étant proposés en exclusivité sur ce serveur à
partir du 2 janvier 1984.
Pour en revenir à Dialog, signalons aussi la présence de Harvard
Business Review depuis 1971 en résumé, avec une sélection pour les
années antérieures et le texte intégral à partir de 1976, comme sur
LexisNexis et Factiva.
En ce qui concerne Factiva, outre le New York Times – résumés
depuis le 1er janvier 1969 et texte intégral depuis début 1996 ;
depuis le 1er juin 1980 sur LexisNexis –, on trouvera le Wall
Street Journal comme évoqué plus haut.
En ce qui concerne le Financial Times, on trouve sur Factiva quatre
résumés d’articles de 1980, puis les résumés de 1981 à 1987 et le
texte complet ensuite. On citera de plus deux sources originales, à
savoir les dépêches de Dow Jones depuis le 13 juin 1979 et le
quotidien canadien The Globe and Mail depuis le 14 novembre
1977.
LES TITRES DE LEXISNEXIS AYANT UNE ANTERIORITE INFERIEURE A
1980
| Latin American
Newsletter |
28.4.1967 |
| New York Times |
1.1.1969 à 31.5.1980
(abstracts puis fulltext ensuite) |
| Wall Street
Journal |
1.5.1973 (abstracts)
|
| Chemical Week |
1.1.1975 |
| Forbes |
1.1.1975 |
| Aviation Week &
Space Technology |
6.1.1975 |
| The Economist |
4.1.1975 |
| NewsWeek |
6.1.1975
|
| Business Week |
13.1.1975 |
| Harvard Business
Review |
1.1.1976 (et non 1977 comme
indiqué dans le répertoire des sources) |
| Associated Press |
1.1.1977 |
| Fortune |
1.1977 |
| Washington
Post |
1.1.1977 |
| Xinhua General
News |
1.1.1977 |
LES SERVICES DE PROQUEST
Les titres et bases de données que nous avons cités dans la
première partie de cet article ont été constitués, pour
l’essentiel, avec des antériorités démarrant au moment de la mise
en ligne et avec, en général, assez peu de numérisation
rétrospective.
Les développements du marché, comme l’évolution rapide des
technologies, ont permis le développement de nouveaux projets de
numérisation rétrospective massive, dont l’objectif est à la fois
de disposer de l’ensemble des archives sous forme d’images et de la
possibilité d’effectuer des recherches sur le texte complet des
articles.
A titre d’exemple en France, Le Monde a un projet de numérisation
des archives depuis l’origine, destiné dans un premier temps à un
usage interne, mais qu’il n’est pas du tout exclu de pouvoir à
terme trouver en ligne.
Cela dit, cela n’est pas précisément pour demain matin, dans la
mesure où le projet de numérisation est à échéance 2005.
Les Américains sont nettement plus avancés dans le domaine car dès
janvier 2001, la société ProQuest a pris une initiative
particulièrement intéressante. Rappelons au passage que ProQuest
est le nouveau nom de Bell & Howell, qui a racheté plusieurs
sociétés du secteur telles que UMI (producteur de d’ABI/Inform et
de Dissertation Abstracts) et Chadwyck Healey dans le domaine des
sciences humaines.
Le projet ProQuest Historical Newspapers a pour objectif de
numériser les journaux depuis le 19ème siècle jusqu’à aujourd’hui.
Tout le contenu est pris en compte, non seulement les articles mais
aussi les photos, les graphiques et les publicités.
La recherche se fait dans l’ensemble du texte avec les opérateurs
booléens classiques, mais aussi des opérateurs de proximité.
Masques et troncatures sont également disponibles.
Nous avons cependant remarqué au cours de nos tests que
l’océrisation du texte n’avait, comme on pouvait le craindre, pas
été parfaite. En effet, ayant édité un article, certaines
stratégies utilisant les mots du texte de l’article permettaient de
le retrouver et d’autres non.
Actuellement, le contenu de quatre titres est disponible : The New
York Times (1851-2001), The Wall Street Journal (1889-1987), The
Washington Post (1877-1988) et The Christian Science Monitor
(1908-1991).
The Los Angeles Times et The Chicago Tribune sont en cours de
digitalisation, mais le projet est très ambitieux (plusieurs
centaines de titres à terme) et ne se limitera sans doute pas à la
presse américaine.
Ce service est accessible de deux façons. L’ensemble n’est
disponible – comme beaucoup de produits vendus par ProQuest – que
sur abonnement annuel, ce qui est infiniment regrettable.
Pour certains titres néanmoins, en l’occurrence le New York Times
et le Washington Post, une autre solution est aujourd’hui
possible si l’on accepte de donner un numéro de carte de crédit sur
le Web.
En se connectant à l’un ou à l’autre site, on peut découvrir un
discret bouton Archives qui en fait renvoie au site de ProQuest,
mais limité aux archives du titre dont on est parti. On peut y
effectuer les recherches gratuitement et visualiser toujours
librement le titre et un résumé. Si l’on veut acheter l’article, il
faut s’inscrire au service ProQuest Archiver, en donnant son mail,
en créant son mot de passe et en entrant son numéro de carte de
crédit.
Lors des connexions suivantes, il suffit de renseigner le mail et
le mot de passe.
Les coûts varient de 2,95 $ pour un article à l’unité à 25,95 $
pour 25 articles à visualiser dans les trois mois.
Le mot de passe est valable sur l’ensemble du service ProQuest
Archiver, c’est-à-dire non seulement pour les archives anciennes de
The New York Times et The Washington Post, mais aussi pour plus de
3 000 titres ayant pour la plupart des antériorités de quelques
années seulement. Nous avons néanmoins découvert que les archives
de The Atlantic Monthly, un magazine couvrant les arts, la
littérature, les sciences politiques et sociales, étaient
disponibles depuis 1857.
Le nombre de titres disponibles via ProQuest Archiver est important
et cette source peut être utile si l’on cherche un titre qui n’est
pas proposé sur les agrégateurs – à titre d’exemple, on trouve les
archives, depuis début 2002, du Daily Breeze, publié à Torrance en
Californie, qui n’est disponible sur aucun serveur (ils offrent
pour leur part le Daily Breeze publié à Cape Coral en Floride).
Précisons néanmoins que ProQuest Archiver n’est pas un agrégateur
et que la recherche se fait titre par titre. D’autre part, ce
service ne permet pas d’interroger directement les titres de
ProQuest Historical Newspapers.
Au total, si ProQuest Archiverdonne accès à un grand nombre de
titres, sa cible semble être plutôt le grand public, lecteur d’un
des trois mille titres disponibles.
Néanmoins, le professionnel de l’information pourra trouver quelque
utilité à ce service, comme source complémentaire de l’offre des
grands serveurs.
INFORMATIONS :
www.pqarchiver.com