Netsources, Numéro de Juillet-Août 2005 - n°57


The Freshness of Web search engines' databases

Le département des sciences de l’information de l’université Heinrich Heine, à Düsseldorf, a mené une étude pour évaluer les fréquences de mise à jour des index des moteurs ; ce critère, trop souvent négligé, est en effet l’un des gages de qualité des outils de recherche.

Auteur : Béatrice Foenix-Riou

Les chercheurs ont pour cela comparé – pour Google, Yahoo! et MSN – comment étaient prises en compte les modifications apportées quotidiennement à 38 sites Web – portails d’actualité, sites scientifiques... – et ce pendant six semaines.

Les conclusions ont montré que, pour ces sites, Google obtenait globalement les meilleures performances, avec 83% de pages mises à jour quotidiennement, mais aussi quelques pages “anciennes”, non raffraîchies depuis au maximum 54 jours.
MSN suivait avec 48 % de pages raffraîchies quotidiennement et avec un point fort : toutes les pages de l’échantillon étaient mises à jour en moins de ving jours.
Quant à Yahoo!, son procédé d’indexation semble être plutôt chaotique et certaines pages étaient très anciennes.
Sinon, le délai moyen de raffraîchissement était de 3,1 jours sur Google, 3,5 sur MSN et 9,8 sur Yahoo!.

Le texte intégral de cette étude – qui donne bien d’autres informations – est disponible dans un rapport de 30 pages, au format PDF.
Langue : anglais
http://eprints.rclis.org/archive/00004619/01/JIS_preprint.pdf