
|
Netsources, Numéro de Mai-Juin 2002 - n°38 AOL.fr: un outil de recherche sur le Web francophone |
Auteur : Béatrice Foenix-Riou |
|
Lorsque l’on se connecte à l’outil de recherche AOL.fr, lancé en
avril 2002 par AOL France, la première impression est plutôt
négative : avant même l’affichage complet des rubriques et
sous-rubriques de l’annuaire, une fenêtre pop-up de publicité
suscite immédiatement un sentiment d’agacement ; la part importante
de l’écran d’accueil réservée aux offres marchandes renforce
l’impression défavorable ; et la lecture des grandes catégories de
l’annuaire (Autos et motos, Cinéma, Shopping, Immobilier, Sports,
Jeux...) donne envie de rebrousser chemin au plus vite avec le
jugement fatal “trop grand public !”.
Cela serait dommage ! A l’essai, AOL.fr révèle en effet un certain nombre de bonnes surprises. Mais commençons par présenter l’outil. Comme le laisse supposer l’écran d’accueil, AOL.fr est un outil de recherche basé principalement autour d’un annuaire. Ce dernier a été constitué à partir des données (sites et catégories) de l’annuaire de Looksmart France, revues et corrigées par la société Cybion. L’équipe de Cybion a procédé à une refonte de l’ensemble de l’arborescence, en supprimant ou en ajoutant des catégories pour tenir compte de l’actualité (“Législatives 2002” ou “Le Loft” par exemple !) et des souhaits d’AOL. Les descriptions de sites ont été vérifiées, mises à jour, complétées, etc. AOL.fr regroupe aujourd’hui 90 000 sites répartis dans 12 000 catégories ; pour comparaison, Yahoo! et Nomade en recensent 150 000, répartis dans 50 000 catégories sur Yahoo! France et 11 000 catégories sur Nomade. Comme tous les annuaires, AOL.fr propose une recherche par clics successifs, depuis les 14 rubriques principales de l’écran d’accueil. On notera — en le regrettant — le parti pris grand public adopté pour les classifications, qui sont très nettement orientées vers l’utilisateur final. Un clic sur une catégorie affiche une page de résultats comportant : - la liste des sous-rubriques, classées par ordre alphabétique. On note que dans cette liste, certaines catégories se distinguent en étant en caractères gras (Actualités et médias par exemple affiche les rubriques : Infos au quotidien ; Journaux et magazines ; Presse par thème ; Radios ; Télévisions ; Webzines). Cette précision signifie que ces rubriques contiennent les sites les plus “populaires” de la base pour ce domaine ; la popularité est calculée, comme pour Google, selon le nombre de liens qui pointent vers le site. - des “services” proposés par AOL ; pour certaines catégories, AOL.fr propose des “services” qui peuvent être utiles à l’internaute : accès aux dernières dépêches scientifiques de l’AFP pour la rubrique Sciences, téléchargement de logiciels pour la rubrique Multimédia, etc. - la liste des sites les plus populaires ; AOL.fr se distingue des autres annuaires en ayant adopté un principe de classification qui lui est propre. Dans AOL.fr, les sites ne sont indexés en effet que dans la catégorie terminale de chaque arborescence, et non dans les sous-rubriques intermédiaires. Lorsque l’on clique sur une rubrique, AOL.fr propose en fait une sélection des sites les plus populaires, tirée des différentes sous-sous-...-rubriques de la catégorie. Pour chaque site, une description est fournie avec le titre, un résumé concis du contenu et l’URL ; un lien Voir les sites similaires permet d’afficher l’ensemble des sites indexés dans la catégorie finale. En complément de cette recherche par arborescence, il est bien sûr possible de lancer une requête par mots sur la base. UN MOTEUR DE RECHERCHE SUR LE WEB FRANCOPHONETraditionnellement, lorsque l’on lance une requête par mots sur un annuaire (Yahoo!, Nomade...), la recherche se fait sur les catégories de l’annuaire et sur les descriptions des sites répertoriés. Avec AOL.fr, la situation est tout autre, et cette originalité est sans conteste le point fort de cet outil. Une recherche par mots sur AOL.fr est en effet lancée, par défaut, sur un index de 50 millions de pages Web francophones. Cet index a été constitué à partir des sites recensés dans l’annuaire : le robot du moteur a indexé les pages de ces sites, mais a également pris en compte un certain nombre de pages non francophones, vers lesquelles pointaient de nombreux liens. Ce moteur utilise la technologie d’Exalead, la société dirigée par François Bourdoncle — rappelons que François Bourdoncle est le concepteur de la regrettée fonctionnalité Refine, qui a existé un temps sur AltaVista. Cette technologie, basée sur des algorithmes statistiques, a été adaptée pour AOL.fr ; elle a ici pour caractéristique principale d’afficher, pour une requête donnée, les mots-clés et expressions connexes ainsi que les catégories pertinentes de l’annuaire. Concrètement, une recherche sur le terme “veille” va afficher successivement, dans la page de résultats : - les rubriques de l’annuaire qui semblent les plus pertinentes, c’est-à-dire celles qui répertorient le plus de sites contenant les termes de la requête dans leurs pages. Dans cet exemple, on obtient trois arborescences : •Secteurs d'activité > Recherche d'information et veille • Sciences humaines et sociales > Sciences de l'info, de la communication > Ressources documentaires • Internet > Référencement > Référencement payant. - les mots-clés ou expressions connexes apparaissant le plus souvent dans les pages qui contiennent les termes de la requête. Pour “veille” par exemple, AOL.fr identifie 291 027 pages, et propose comme autres mots-clés pour affiner la sélection : Écrans de veille ; Veille technologique ; Veille concurrentielle ; Intelligence économique ; Agents intelligents ; Veille stratégique ; Outil de veille... - Vient ensuite la liste des pages sélectionnées, classées par popularité. Pour chaque page identifiée, AOL.fr donne son titre, un extrait pertinent de la page (les mots de la requête étant en gras) et l’URL ; si la page correspond à la page d’accueil d’un site recensé par l’annuaire, on trouve également la description du site et la catégorie dans laquelle il est indexé. En complément de cette recherche sur le Web français, AOL.fr propose, sous la zone de saisie, l’option “Web mondial”. En activant cette option, on lance la recherche sur l’index d’un milliard de pages d’Inktomi. Dans ce cas toutefois, la technologie d’Exalead (identification de mots et expressions connexes) n’est pas utilisée. En conclusion, le portail AOL.fr mérite que l’on s’y arrête. Les différentes spécificités apportées par Exalead (signalement en gras des catégories pertinentes, affichage des mots et expressions connexes...) vont sans nul doute aider l’utilisateur dans sa requête, en le guidant pas à pas. Ces spécificités deviennent fort utiles dès lors que les annuaires recensent un grand nombre de sites, classés dans une arborescence qui manque souvent de rigueur... Par ailleurs, l’interrogation simultanée d’un annuaire de sites Web ET d’un moteur de recherche permet de combiner la pertinence d’une liste de sites indexés dans une catégorie et la précision d’une recherche par mots sur le texte des pages. On regrettera cependant que les possibilités de recherche soient basiques, et qu’aucune indication ne soient données sur la syntaxe d’interrogation. Les quelques tests que nous avons effectués semblent montrer que l’outil est insensible à l’accentuation. Mais il est difficile de déterminer l’opérateur employé par défaut (s’il y en a un !). Ainsi, la requête droit privé sélectionne 29 211 pages, “droit privé” 32 554 pages, et +droit +privé 149 254... Bizarre, autant qu’étrange ! Mais peut-être doit-on avoir un peu d’indulgence devant la jeunesse d’AOL.fr... www.aol.fr AOL France 115/123 av. Charles de Gaulle, 92525 Neuilly-sur-Seine Cedex Tél.: 01 72 25 00 00, E-Mail: courriersc@aol.com |
|