|
Netsources, Numéro de Novembre-Décembre 2004 - n°53 Exalead.frUn outsider à surveiller de près |
Auteur : Béatrice Foenix-Riou |
|||
|
L’ingénieur X-Mines François Bourdoncle – l’un des fondateurs de la
société Exalead – n’est pas à proprement parler un nouveau venu
dans le monde des outils de recherche. Il a participé à la création
du moteur AltaVista et fut à cette époque l’inventeur d’une
fonctionnalité innovante – la fonction Refine –, malheureusement
abandonnée par la suite.
Utilisant la technologie LiveTopics, cette fonction Refine permettait aux internautes, lors d’une recherche sur le moteur, d’afficher sous forme cartographique les mots et expressions qui revenaient le plus souvent dans les pages de résultats. Et l’on disposait alors d’une aide efficace pour affiner sa requête. C’est pour développer notamment cette technologie et la commercialiser que François Bourdoncle a créé Exalead, en 1999. Il a incontestablement réussi son pari, puisque la technologie Exalead est utilisée aujourd’hui par de nombreuses entreprises (dans leurs intranets...), mais aussi par des outils de recherche comme AOL France. Lorsque l’on interroge AOL on obtient ainsi, en plus des résultats de l’outil, une série de mots et expressions connexes qui sont l’un des points forts de cet hybride moteur/annuaire bien particulier (voir Netsources n°46). Jusqu’ici cependant, Exalead se contentait de vendre sa technologie à d’autres, mais n’offrait pas d’outil de recherche à part entière. Si le site Exalead.com permettait de lancer des requêtes sur un index de pages Web – illustrant ainsi tout l’intérêt de la technologie –, ce site n’était en fait qu’un site vitrine des produits de la société et l’index du moteur se limitait à 150 000 pages... C’était du moins la situation jusqu’en octobre 2004. Depuis cette date en effet, les adresses beta.exalead.fr et beta.exalead.com donnent accès aux versions bêta – c’est à dire aux versions encore en phase de test – des interfaces en français et en anglais d’un moteur de recherche indexant près d’un milliard de pages Web (le moteur annonce plus de 918 millions de pages, mais il devrait atteindre – puis dépasser – le milliard d’ici peu)... Certes, l’on est bien loin des huit milliards de pages annoncées par Google (voir p.12), mais ce volume fait néanmoins d’Exalead un moteur d’une taille “honnête”, qu’il peut être intéressant d’interroger dès lors que l’on souhaite identifier quelques documents sur un sujet. D’autant qu’Exalead possède sur ses concurrents des atouts certains. UNE PAGE DE RESULTATS AUX MULTIPLES ENTREES
Après avoir lancé une recherche par mots sur Exalead, on obtient un écran composé de plusieurs ensembles. La partie centrale de l’écran affiche, classiquement, la liste des pages identifiées, avec leur titre, un extrait pertinent, l’URL et la taille de la page. La date de dernière modification de la page est quelquefois inscrite à la suite de l’URL, mais ce n’est pas systématique. Pour plus de clarté, le moteur n’affiche qu’une page pertinente par site. Lorsque plusieurs pages d’un site répondent à la requête, une icône représentant un dossier est placé à gauche de l’URL (lorsqu’il n’y en a qu’une, l’icône représente une page). En cliquant sur l’URL, on affiche alors toutes les pages pertinentes du site. En complément de ces données on trouve, lorsque la page identifiée est la page d’accueil d’un site recensé dans l’annuaire de l’Open Directory (www.dmoz.org), la rubrique dans laquelle le site est indexé dans l’annuaire et l’arborescence qui mène à elle (ex.: Informatique : Internet : Ressources : Répertoires ou encore Commerce et économie : Informatique : Internet : Conception de sites). Si l’on clique sur l’une de ces catégories, on affiche dans la partie centrale la liste des autres sites indexés dans la rubrique par Dmoz. On trouve enfin, sur la droite de chaque résultat, une vignette donnant un aperçu graphique du contenu de la page. Cette fonction permet de retrouver aisément les sites que l’on connaît et peut donner une idée du contenu des autres. Ces vignettes sont également offertes par AOL France (voir Netsources n°50). Lorsque l’on glisse le curseur sur la liste des résultats, on voit apparaître un encadré en pointillé entourant chaque page. Un clic sur ce bandeau affiche dans la moitié inférieure de l’écran une “prévisualisation” de la page, avec les mots en surbrillance. Et l’on peut alors naviguer par clics dans le document, à la recherche des termes pertinents. On notera qu’il s’agit ici de la page réllement en ligne, et non d’une copie “en cache” comme sur Google ou Yahoo!. Cela étant, on regrettera que, pour le moment du moins, les mots de la requête apparaissent tous surlignés de la même couleur (jaune), quand Google ou Yahoo! notamment font apparaître chaque mot dans une couleur différente ; cela est bien plus efficace pour repérer la proximité des mots-clés et par là-même la pertinence des pages. Mais c’est avec les informations de la colonne de gauche qu’Exalead se démarque le plus de ses concurrents. Le moteur offre en effet, successivement : • Les termes associésC’est la rubrique phare du site, puisqu’elle illustre en fait tout l’intérêt de la technologie d’Exalead. Grâce à une analyse statistico-sémantique des pages de résultats, Exalead identifie les mots composés et expressions qui apparaissent le plus souvent dans les pages pertinentes – plusieurs milliers d’entre elles sont analysées – et les indique à l’utilisateur.Une recherche sur le mot “veille” par exemple propose d’affiner la requête avec des expressions comme “veille technologique”, “veille concurrentielle”, “veille stratégique sur Internet”, “écran de veille”, “cellule de veille”, quand une requête sur “endartériectomie” propose “chirurgie vasculaire”, “accident ischémique” ou “fibrillation auriculaire”... Des suggestions bien utiles lorsque l’on ne connaît pas parfaitement le domaine de recherche ou que l’on manque tout simplement d’inspiration... Certes, cette fonction n’est pas franchement innovante, puisqu’AOL France l’utilise déjà et que des métamoteurs comme Vivisimo, KillerInfo ou Kartoo emploient des technologies similaires. Mais ici, des petits bonus sont offerts. Ainsi – et comme c’est le cas avec les autres outils –, l’opérateur AND est utilisé implicitement ; lorsque l’on clique sur l’un des termes suggérés, celui-ci est donc automatiquement ajouté à la requête et l’on obtient une nouvelle page de résultats avec de nouveaux termes associés. Mais en complément, Exalead permet aussi d’utiliser implicitement l’opérateur NOT, et donc de supprimer des résultats les pages contenant certains termes. Il suffit pour cela de cliquer non sur le nom, mais sur le petit carré situé immédiatement à sa gauche. Et le terme supprimé apparaît alors, en gras et barré d’un trait, en haut de la nouvelle liste de mots associés. Cette option toute simple permet d’effacer rapidement une partie du “bruit” de la liste des résultats. • Les rubriques associéesOn retrouve dans cet encadré la liste des rubriques et sous-rubriques les plus pertinentes de l’annuaire Dmoz ; il suffit alors de cliquer sur l’une d’elle pour afficher, dans la colonne de gauche, les éventuelles sous-rubriques et, dans la partie centrale, les sites qui y sont indexés.• Localisation des sitesCette fonction permet d’affiner la recherche selon la localisation géographique des sites (et non des pages).Les renseignements sont issus de l’annuaire Dmoz et correspondent en fait au classement, par continents et pays (Europe : France, Suisse, Belgique ; Amérique : Canada...), des sites de Dmoz répondant à la requête. Les pages identifiées via l’index du moteur ne sont en revanche pas prises en compte dans ce classement géographique. Une telle rubrique peut être utile lorsque l’on souhaite, par exemple, identifier des sites dans un pays donné – même s’il existe dans ce cas des méthodologies mieux adaptées, comme de partir d’un outil tel que Search Engine Colossus (voir Netsources n°46). • Le type du documentDernier choix offert par Exalead : limiter la requête selon le type de document.Le moteur précise donc dans cette rubrique les différents formats identifiés parmi les documents pertinents : PDF, DOC (Word), PPT (PowerPoint), XLS (Excel), etc. EXALEAD : DE LA RECHERCHE A L’EXPLORATIONEn offrant sur un même écran ces diverses fonctionnalités, Exalead permet en fait à l’internaute de passer d’une recherche par mots à une exploration par choix successifs, que ces choix concernent les mots-clés, les types de sites (selon leur classement dans l’annuaire), leur localisation ou leur format. C’est dans ce concept que réside toute l’originalité et le savoir-faire d’Exalead. Car si la taille de l’index est l’une des composantes importantes de la qualité d’un moteur, c’est loin d’être la seule. Que faire en effet lorsque les premières pages de résultats sur Google ne répondent pas aux attentes ? Comment reformuler ou préciser sa question ? Nombreux sont les internautes qui ont été confrontés à de tels dilemnes... C’est dans cette situation qu’Exalead apporte une réelle valeur ajoutée, face à des géants comme Google. Certes, la taille de l’index de Google et la qualité de son algorithme de classement font que l’on préfèrera ce moteur, dès lors que l’on sait précisément ce que l’on recherche. En revanche, lorsque l’on maîtrise mal le sujet ou que l’on souhaite avoir un “tour d’horizon de l’offre”, l’interrogation d’Exalead apportera une aide précieuse. D’autant que ce dernier ajoute, aux fonctionnalités déjà présentées, des options de recherche sophistiquées. UNE RECHERCHE AVANCEE SOPHISTIQUEES’il fut un temps où les moteurs rivalisaient pour offrir les fonctionnalités de recherche les plus avancées – AltaVista étant à cette époque le leader incontesté en la matière –, le “phénomène Google” a malheureusement nivelé l’offre vers le bas... En misant trop sur la “simplicité” de son interface pour attirer les internautes, Google a en quelque sorte renié ses fonctions avancées. Il est navrant de voir que cet outil de recherche majeur ne donne aucune indication – sur sa version française du moins – concernant l’emploi des opérateurs intitle:, inurl:..., alors que ceux-ci peuvent apporter une aide précieuse au netsurfer. Exalead en revanche n’oublie pas l’utilisateur averti et lui offre toute une gamme de possibilités. On trouvera dans le tableau page suivante les principales d’entre-elles. On remarquera, en particulier, la variété des types de recherche offerts. Depuis sa grille avancée, Exalead propose ainsi : • de lancer une recherche exacte – c’est le principe adopté par la plupart des moteurs ; • de rechercher les racines de mots ; on saluera particulièrement cette initiative ; Exalead est en effet l’un des rares moteurs à permettre l’utilisation de la troncature, qui fait cruellement défaut lors de recherches sur Google, Yahoo!... ; • de lancer des recherches phonétiques, ou sur des orthographes approchées ; ces deux options originales seront utiles notamment pour les noms propres apparaissant avec plusieurs orthographes différentes sur le Web... D’autre part, et pour séduire les internautes, Exalead n’hésite pas à offrir de “petits plus”. Ainsi, depuis la fenêtre de prévisualisation, un onglet “Ajouter un signet” permet de sauvegarder l’adresse d’un site jugé pertinent, afin de l’enregistrer ensuite dans ses favoris. La liste des sites enregistrés s’affiche dans la colonne de gauche, sous la fenêtre “Type du document”... Les cruciverbistes comme les informaticiens ne sont pas non plus oubliés. Exalead leur offre des fonctionnalités de recherche complexes sur les “expressions régulières”, permettant de spécifier avec une grande précision un ensemble flou de termes. Enfin, Exalead propose aux amateurs de musiques et de vidéos de repérer directement les pages contenant des fichiers audio ou vidéo – après avoir lancé une recherche sur le Web –, en cliquant sur les onglets éponymes situés à droite du nombre de résultats. On le voit, le moteur français Exalead se lance sans peur et sans complexe sur un marché dominé par les trois géants américains. Il a pour cela mis dans ses bagages un nombre important d’atouts et propose à l’internaute une nouvelle expérience de la recherche, basée sur la navigation interactive et la simplicité d’utilisation. Certes, la version actuelle peut encore être améliorée – on aimerait par exemple un opérateur pour rechercher sur l’URL, des mots en surbrillance de différentes couleurs, etc –, mais c’est bien pour cela qu’elle est encore en version bêta... D’ores et déjà toutefois, Exalead apporte une aide inestimable pour certaines recherches et mérite à ce titre d’être utilisé sans modération. Nous lui souhaitons tout le succès qu’il mérite !
|
||||