Actualités
Agenda
Liens utiles
Netsource
Netsource - Sommaire en cours
Netsource - Anciens sommaires
Netsource - Recherche des archives
Revue Bases
Revue Bases - Sommaire en cours
Revue Bases - Anciens sommaires
Revue Bases - Recherche des archives
Ouvrages
Qui sommes-nous ?
Notre équipe
Accueil > Bases > Anciens sommaires > Amazon.com débute dans le texte intégral

Bases, Numéro de Septembre 2003 - n°197


Amazon.com débute dans le texte intégral

Auteur : Madeleine Wolff-Terroine

 
Avec la fonction Search inside the Book, on peut désormais sur le site Amazon.com explorer le texte intégral de 33 millions de pages, issues d’environ 120 000 livres. Ces derniers proviennent de 190 maisons d’édition participant à ce programme, parmi lesquelles quelques très grandes comme Wiley ou Time Warner.
   
Comme le dit Amazon, cette nouvelle possibilité n’est d’ailleurs que “a significant extension” du service Look inside the Book, qui était déjà en ligne en octobre 2001.
   
Search inside the Book est très simple à utiliser, puisqu’il est intégré dans le formulaire de recherche présent sur le site.
Lors d’une requête par mots (“search engines” par exemple), on peut désormais trouver dans le listing classique des résultats avec titre des ouvrages et noms des auteurs, certains titres accompagnés d’un bref fragment de texte portant la mention NEW • Excerpt from page xx, avec les termes de la requête en gras.
   
On peut alors, si on le souhaite, cliquer sur sur le lien “See more references to "search engines" in this book”, et afficher les extraits d’une sélection des pages du livre contenant les termes de la requête.
   
Surmontant la page de résultats, une barre de navigation propose des liens vers la couverture du livre, la table des matières, quelques pages, un index, la quatrième de couverture...
   
Il est par ailleurs possible d’afficher le texte intégral d’une page citée, en cliquant sur son numéro. On peut ensuite se promener en amont et en aval, dans les pages du livre qui ont été sélectionnées.

Si l’impression des pages était offert à l’origine, il est question de supprimer ce service, à la demande des auteurs.
Le but du service est en effet d’aider l’internaute à choisir le livre qu’il souhaite acheter ; la mise en ligne du texte intégral de certaines pages n’est ici qu’un moyen commercial.
   
D’autre part, pour afficher le texte intégral des pages, il est nécessaire d’indiquer son adresse e-mail et son nom, de choisir un mot de passe, mais aussi, et c’est plus ennuyeux, de remplir un formulaire en indiquant notamment le numéro de sa carte de crédit, sa date d’expiration, l’adresse de facturation, etc.
Le service est certes gratuit - il est bien précisé Your account will not be charged –, mais il est destiné avant tout aux clients d’Amazon.com...
   
Pour sa recherche, Amazon – comme beaucoup de moteurs – utilise le ET implicite entre les termes de la requête.
La recherche de phrase peut se faire grâce à l’utilisation des guillemets (“search engines” par exemple), mais il n’y a pas de recherche avancée, ni de possibilités de limites. De ce fait, la recherche par expression peut donner des résultats non pertinents.
Autre point négatif : la recherche se fait sur le texte intégral des pages, mais pas sur deux éléments essentiels du livre, la table des matières et l’index ; c’est dommage, d’autant que ces documents sont numérisés et proposés par le service...
   
Pour faciliter à ses utilisateurs l’accès à ce nouveau service, Amazon en donne une très bonne description dans “How it works”. Sa page avec les réponses aux FAQ est aussi très bien rédigée.
   
Amazon.com est le premier “vendeur de livres” (ce n’est quand même pas un libraire) à offrir ce type de service, mais il ne faudrait pas oublier que de nombreuses bibliothèques offrent déjà un accès au texte intégral et d’autres possibilités, pour des milliers de livres.
On citera par exemple, l’OCLC  (Online Computer Library Center) avec netLibrary, Ebrary en Californie, le remarquable Online Books Page de l’Université de Pennsylvanie…
   
L’OCLC vient d’ailleurs d’annoncer la mise en place, d’ici la fin de l’année, d’un partenariat avec le moteur Google dans ce domaine. L’organisme compte en effet ouvrir sa base de données WorldCat au moteur, et permettre par là-même l’indexation par Google de 2 millions de titres, sur les 53 proposés ; l’objectif de WorldCat est de permettre à l’utilisateur d’identifier des ressources de bibliothèques via des outils de recherche généralistes.
   
En attendant, les éditeurs et les libraires suivent d’un œil attentif mais prudent cette initiative prise par Amazon de numérisation et d’accès par mots-clés aux publications non-littéraires.
 
Pour en savoir plus :

- SearchDay 647, 27 October
- www.amazon.com
- www.netlibrary.com
- www.ebrary.com
- digital.library.upenn.edu/books
- www.oclc.org/worldcat/pilot/default.htm

 

Version imprimable
BASES PUBLICATIONS
27, rue de la Vistule
75013 Paris
Tél. : 01.45.82.75.75
contact@bases-publications.com
Abonnez-vous   |   Contact   |   Mentions légales |   Crédits