
|
Netsources, Numéro de Juillet-Août 2005 - n°57 The Freshness of Web search engines' databasesLe département des sciences de l’information de l’université Heinrich Heine, à Düsseldorf, a mené une étude pour évaluer les fréquences de mise à jour des index des moteurs ; ce critère, trop souvent négligé, est en effet l’un des gages de qualité des outils de recherche. |
Auteur : Béatrice Foenix-Riou |
|
Les chercheurs ont pour cela comparé – pour Google, Yahoo! et MSN –
comment étaient prises en compte les modifications apportées
quotidiennement à 38 sites Web – portails d’actualité, sites
scientifiques... – et ce pendant six semaines.
Les conclusions ont montré que, pour ces sites, Google obtenait globalement les meilleures performances, avec 83% de pages mises à jour quotidiennement, mais aussi quelques pages “anciennes”, non raffraîchies depuis au maximum 54 jours. MSN suivait avec 48 % de pages raffraîchies quotidiennement et avec un point fort : toutes les pages de l’échantillon étaient mises à jour en moins de ving jours. Quant à Yahoo!, son procédé d’indexation semble être plutôt chaotique et certaines pages étaient très anciennes. Sinon, le délai moyen de raffraîchissement était de 3,1 jours sur Google, 3,5 sur MSN et 9,8 sur Yahoo!. Le texte intégral de cette étude – qui donne bien d’autres informations – est disponible dans un rapport de 30 pages, au format PDF. Langue : anglais http://eprints.rclis.org/archive/00004619/01/JIS_preprint.pdf |
|