Actualités
Agenda
Liens utiles
Netsource
Netsource - Sommaire en cours
Netsource - Anciens sommaires
Netsource - Recherche des archives
Revue Bases
Revue Bases - Sommaire en cours
Revue Bases - Anciens sommaires
Revue Bases - Recherche des archives
Ouvrages
Qui sommes-nous ?
Notre équipe
Accueil > Bases > Anciens sommaires > Où trouver des articles de presse anciens en ligne ?

Bases, Numéro de Avril 2004 - n°204


Où trouver des articles de presse anciens en ligne ?

Auteur : François Libmann

 
Il arrive parfois que l’on ait à effectuer une recherche d’informations sur des périodes anciennes.
La mise à disposition d’archives papier a évidemment été réalisée bien avant l’avènement de l’information électronique.

Nombre de ces dernières sont à la disposition des chercheurs, avec parfois des antériorités très grandes ; mais les recherches dans ces fonds riches et variés ne se font pas à distance et prennent facilement un temps important.
On a vu en particulier se développer une offre assez riche de cédéroms ou de produits en ligne sur Internet, disponibles uniquement dans le cadre d’un abonnement annuel. Mais sauf à appartenir à une organisation qui a souscrit à de tels produits, ou à pouvoir se déplacer dans une bibliothèque qui y donne accès, le documentaliste qui souhaite occasionnellement trouver rapidement en ligne un article ancien dispose d’un champ de possibilités beaucoup plus restreint.

C’est à lui que nous nous intéresserons dans cet article – à celui qui interroge des banques de données en ligne –, en limitant notre investigation au domaine de la presse généraliste ou technico-économique.

On rappellera néanmoins que dans le domaine de l’information en ligne, les références d’articles de type scientifique remontent souvent aux années soixante. Chemical Abstracts pour sa part a une politique délibérée de remontée dans le temps, puisque les documents les plus anciens disponibles aujourd’hui sur STN datent de 1907  – 600 d’entre eux font même figurent d’exception et sont antérieurs à cette date. Il faut préciser que cette remontée dans le temps, un peu atypique dans le domaine scientifique, est particulière au secteur de la chimie, dans lequel des informations très anciennes peuvent garder une grande valeur.

DataStar vient par ailleurs de mettre en ligne OldMedline (ME65, qui est aussi une partie de MEZZ, l’ensemble du fichier) ; cette base couvre la période 1951-1965, sachant que les références sont moins complètes que celles de périodes plus récentes.

On trouvera dans le tableau ci-contre quelques exemples d’antériorité de banques de données de type scientifique et technique.

LES BANQUES DE DONNEES BIBLIOGRAPHIQUES

Dans le domaine de la presse généraliste ou technico-économique, on a vu apparaître quelques bases bibliographiques avec des citations et quelquefois des résumés.

La plus célèbre est Promt, qui a démarré en 1972. On trouve aujourd’hui sur Dialog (fichier 160) la partie la plus ancienne de cette base (1972-1989), alors que l’antériorité n’est que de 1978 sur STN et de 1982 sur DataStar. Quant à LexisNexis, les plus anciens documents issus de Promt remontent au début 1995.

On signalera aussi :
- ABI/Inform, plus orientée sur le management, qui remonte à 1971 sur Dialog, avec 1 732 références avec résumés de documents publiés cette année-là. On a vu par ailleurs arriver le texte intégral de certains documents à partir de 1992.
- Chemical Industry Notes, démarre en 1974 ; ses résumés ne sont disponibles que sur STN et pas sur Dialog, comme c’est le cas pour la base Chemical Abstracts, du même producteur ;
- on signalera enfin le contenu de Textline, l’ancêtre de Reuters Business Briefing, inclus maintenant dans Factiva et qui démarre début 1980.
Malheureusement, le titre indiqué pour tous les articles ou résumés d’articles est invariablement “Textline Multiple Sources Collection (1980-1994)”. Le nom des publications dont sont tirées les informations n’apparaît quant à lui qu’en abrégé.
Si certains sont évidents – comme FT pour Financial Times –, il faudrait, pour d’autres, avoir sous la main la documentation que le producteur de Textline n’avait pas manqué d’éditer en son temps...

Les banques de données Isis et Grappe – banques de données françaises de même nature que Promt – ont démarré elles aussi à cette époque. Grappe a été lancée  en  novembre 1979, sur feu le serveur SG2 Citere, puis à partir d’octobre 1983 sur Télésystemes Questel. Isis quant à elle a démarré en janvier 1981 sur G.Cam serveur.
Elles ont finalement – et cela aurait dû être fait bien plus tôt – fusionné en décembre 1987 pour donner naissance à Delphes, disponible aujourd’hui sur de nombreux serveurs.

Hélàs, seules les cinq dernières années de cette banque de données, plus l’année en cours – c’est-à-dire aujourd’hui depuis 1999 – sont disponibles sur les serveurs. Il est vrai que la partie la plus ancienne était peu interrogée ;  c’est la raison qui a dicté ce choix.
Les archives ne sont plus accessibles que sur un cédérom diffusé par la société Indexpresse, pour la période 1980-1996 ; le cédérom couvrant la période 1980-1998 devrait être très prochainement disponible.

Signalons, en le regrettant également, que la Chambre de Commerce et d’Industrie de Paris ne garantit pas la fourniture de documents primaires, pour les documents qui ne sont plus en ligne.
ANTERIORITE DE QUELQUES BASES BIBLIOGRAPHIQUES DU DOMAINE SCIENTIFIQUE OU BREVET
  Medline (biomédical)   1951 sur DataStar
 Sport Discus (sport)   1962
  Derwent World Patents Index (brevets)   1963
  American History and Life (histoire)   1963
  NTIS (multidisciplinaire)    1964
  Brevets français   1966 (1961 pour les brevets spéciaux de médicaments)
  Eric (pédagogie)    1966
  Weldasearch (soudure)    1966
  World Textile (textile)   1968  
 
  Biosis Preview (biologie)    1969
  Inspec (électronique)   1969
  EI Compendex (ingénierie)    1970
  Agricola (agriculture)    1970
  Tris (transport)    1970


LA PRESSE SUR LES AGREGATEURS

Pour les titres de presse générale ou économique dont le texte intégral est en ligne, nous avons voulu faire le tour de ce qui était disponible sur les serveurs agrégateurs.En fait, deux serveurs ont clairement une politique de mise à disposition d’archives ancien-nes ; il s’agit de L’Européenne de données pour la France et de LexisNexis au niveau international.

On trouve en effet sur L’Européenne de Données la totalité des archives du service documentaire de l’AFP (AFP Doc) depuis ... 1951, ce fichier reprenant une sélection de dépêches considérées comme documents de fond. Les plus anciennes dépêches publiées en 1951 sont au nombre de quatre et présentent la biographie de Pétain puis, en 1953, quatre dépêches reprennent la biographie de Staline. Ensuite, jusqu’aux années 80, il y a quelques dizaines de dépêches par an, qui sont essentiellement des panoramas de l’année. A partir de 1981 – avec néanmoins un creux de 1984 à 1987 –, on trouve entre 2 000 et 4 000 documents par an.

Petite astuce d’interrogation : le choix de date le plus ancien dans l’écran de recherche étant 1973, il faut passer par l’option Personnalisée dans la fenêtre Période pour accéder aux documents antérieurs à 1973.

L’autre source ayant une grande antériorité est Le Monde Diplomatique, en cours de chargement, dont les archives remontent au 1er janvier 1973.
Si l’on se rapproche de la période actuelle, on notera que le fil général de l’AFP est disponible depuis le 7 juillet 1983 et le fil économique depuis le 1er août 1983, les autres serveurs n’ayant que des dépêches plus récentes (1991 ou 1992 pour DataStar, 2001 pour Europresse).

En matière de presse quotidienne, le titre ayant la plus grande antériorité est Le Monde ; ses archives sur L’Européenne de Données – comme sur la plupart des autres serveurs – remontent au début 1987.

Ce n’est ensuite que dans les années 1990 (2 février 1990 pour L’Humanité, 1er mars pour La Tribune, puis 5 janvier 1991 pour Les Echos, 2 janvier 1995 pour Libération...) que le mouvement de mise en ligne a commencé à se développer et, plus récemment encore – fin des années 90/début des années 2000 – qu’il a pris de l’ampleur.

Si l’on se tourne vers la presse internationale, c’est incontestablement le serveur LexisNexis qui a l’offre la plus riche de différents titres quotidiens ou non, dont l’antériorité remonte aux années 1970, comme on le verra dans le tableau ci-dessous. Signalons que le texte intégral du Financial Times n’est disponible “que” depuis 1982, comme sur Dialog et DataStar.

Sur Dialog, mis à part Promt et ABI/Inform signalées plus haut et qui proposent des références à une sélection d’articles d’un grand nombre de publications, on trouve les résumés du New York Times depuis début 1969 et ceux du Wall Street Journal depuis le 1er mai 1973, comme sur LexisNexis. Curieusement sur Factiva, ces résumés ne sont disponibles qu’à partir du 13 juin 1979, les articles en texte intégral étant proposés en exclusivité sur ce serveur à partir du 2 janvier 1984.

Pour en revenir à Dialog, signalons aussi la présence de Harvard Business Review depuis 1971 en résumé, avec une sélection pour les années antérieures et le texte intégral à partir de 1976, comme sur LexisNexis et Factiva.
En ce qui concerne Factiva, outre le New York Times – résumés depuis le 1er janvier 1969 et texte intégral depuis début 1996 ; depuis le 1er juin 1980 sur LexisNexis –, on trouvera le Wall Street Journal comme évoqué plus haut.
En ce qui concerne le Financial Times, on trouve sur Factiva quatre résumés d’articles de 1980, puis les résumés de 1981 à 1987 et le texte complet ensuite. On citera de plus deux sources originales, à savoir les dépêches de Dow Jones depuis le 13 juin 1979 et le quotidien canadien The Globe and Mail depuis le 14 novembre 1977.
LES TITRES DE LEXISNEXIS AYANT UNE ANTERIORITE INFERIEURE A 1980

  Latin American Newsletter    28.4.1967
   New York Times   1.1.1969 à 31.5.1980 (abstracts puis fulltext ensuite)
   Wall Street Journal   1.5.1973 (abstracts)  

   Chemical Week   1.1.1975
   Forbes   1.1.1975
   Aviation Week & Space Technology   6.1.1975
   The Economist   4.1.1975
  NewsWeek   6.1.1975  
 
   Business Week   13.1.1975
   Harvard Business Review   1.1.1976 (et non 1977 comme indiqué dans le répertoire des sources)
   Associated Press    1.1.1977
   Fortune    1.1977
  Washington Post      1.1.1977
  Xinhua General News     1.1.1977


LES SERVICES DE PROQUEST


Les titres et bases de données que nous avons cités dans la première partie de cet article ont été constitués, pour l’essentiel, avec des antériorités démarrant au moment de la mise en ligne et avec, en général, assez peu de numérisation rétrospective.

Les développements du marché, comme l’évolution rapide des technologies, ont permis le développement de nouveaux projets de numérisation rétrospective massive, dont l’objectif est à la fois de disposer de l’ensemble des archives sous forme d’images et de la possibilité d’effectuer des recherches sur le texte complet des articles.
A titre d’exemple en France, Le Monde a un projet de numérisation des archives depuis l’origine, destiné dans un premier temps à un usage interne, mais qu’il n’est pas du tout exclu de pouvoir à terme trouver en ligne.
Cela dit, cela n’est pas précisément pour demain matin, dans la mesure où le projet de numérisation est à échéance 2005.

Les Américains sont nettement plus avancés dans le domaine car dès janvier 2001, la société ProQuest a pris une initiative particulièrement intéressante. Rappelons au passage que ProQuest est le nouveau nom de Bell & Howell, qui a racheté plusieurs sociétés du secteur telles que UMI (producteur de d’ABI/Inform et de Dissertation Abstracts) et Chadwyck Healey dans le domaine des sciences humaines.

Le projet ProQuest Historical Newspapers a pour objectif de numériser les journaux depuis le 19ème siècle jusqu’à aujourd’hui. Tout le contenu est pris en compte, non seulement les articles mais aussi les photos, les graphiques et les publicités.

La recherche se fait dans l’ensemble du texte avec les opérateurs booléens classiques, mais aussi des opérateurs de proximité. Masques et troncatures sont également disponibles.
Nous avons cependant remarqué au cours de nos tests que l’océrisation du texte n’avait, comme on pouvait le craindre, pas été parfaite. En effet, ayant édité un article, certaines stratégies utilisant les mots du texte de l’article permettaient de le retrouver et d’autres non.

Actuellement, le contenu de quatre titres est disponible : The New York Times (1851-2001), The Wall Street Journal (1889-1987), The Washington Post (1877-1988) et The Christian Science Monitor (1908-1991).
The Los Angeles Times et The Chicago Tribune sont en cours de digitalisation, mais le projet est très ambitieux (plusieurs centaines de titres à terme) et ne se limitera sans doute pas à la presse américaine.

Ce service est accessible de deux façons. L’ensemble n’est disponible – comme beaucoup de produits vendus par ProQuest – que sur abonnement annuel, ce qui est infiniment regrettable.
Pour certains titres néanmoins, en l’occurrence le New York Times et le Washington Post, une autre solution est aujourd’hui  possible si l’on accepte de donner un numéro de carte de crédit sur le Web.

En se connectant à l’un ou à l’autre site, on peut découvrir un discret bouton Archives qui en fait renvoie au site de ProQuest, mais limité aux archives du titre dont on est parti. On peut y effectuer les recherches gratuitement et visualiser toujours librement le titre et un résumé. Si l’on veut acheter l’article, il faut s’inscrire au service ProQuest Archiver, en donnant son mail, en créant son mot de passe et en entrant son numéro de carte de crédit.
Lors des connexions suivantes, il suffit de renseigner le mail et le mot de passe.

Les coûts varient de 2,95 $ pour un article à l’unité à 25,95 $ pour 25 articles à visualiser dans les trois mois.
Le mot de passe est valable sur l’ensemble du service ProQuest Archiver, c’est-à-dire non seulement pour les archives anciennes de The New York Times et The Washington Post, mais aussi pour plus de 3 000 titres ayant pour la plupart des antériorités de quelques années seulement. Nous avons néanmoins découvert que les archives de The Atlantic Monthly, un magazine couvrant les arts, la littérature, les sciences politiques et sociales, étaient disponibles depuis 1857.

Le nombre de titres disponibles via ProQuest Archiver est important et cette source peut être utile si l’on cherche un titre qui n’est pas proposé sur les agrégateurs – à titre d’exemple, on trouve les archives, depuis début 2002, du Daily Breeze, publié à Torrance en Californie, qui n’est disponible sur aucun serveur (ils offrent pour leur part le Daily Breeze publié à Cape Coral en Floride). Précisons néanmoins que ProQuest Archiver n’est pas un agrégateur et que la recherche se fait titre par titre.  D’autre part, ce service ne permet pas d’interroger directement les titres de ProQuest Historical Newspapers.

Au total, si ProQuest Archiverdonne accès à un grand nombre de titres, sa cible semble être plutôt le grand public, lecteur d’un des trois mille titres disponibles.
Néanmoins, le professionnel de l’information pourra trouver quelque utilité à ce service, comme source complémentaire de l’offre des grands serveurs.

INFORMATIONS : www.pqarchiver.com































 

Version imprimable
BASES PUBLICATIONS
27, rue de la Vistule
75013 Paris
Tél. : 01.45.82.75.75
contact@bases-publications.com
Abonnez-vous   |   Contact   |   Mentions légales |   Crédits