|
Netsources, Numéro de Janvier-Février 2002 - n°36 Vivisimo, un métamoteur original et puissant(www.vivisimo.com) |
Auteur : Madeleine Wolff-Terroine |
|
Vivisimo est
un métamoteur qui possède trois caractéristiques : sa syntaxe
d’interrogation, sa capacité à interroger jusqu’à quinze outils de
recherche simultanément, et son mode de classement des résultats.
Nous ajouterions volontiers une quatrième caractéristique, et non
des moindres, sa gratuité, quel que soit le mode d’interrogation,
simple ou complexe.
LA SYNTAXE D’INTERROGATIONLes possibilités de recherche de Vivisimo sont particulièrement riches pour un métamoteur. La grille de recherche avancée permet ainsi d’utiliser les trois opérateurs booléens (AND, OR, NOT), comme l’opérateur de proximité NEAR, les parenthèses et les guillemets. Mais surtout, Vivisimo permet de combiner les fonctionnalités avancées des outils de recherche, ce qui est pour le moins inhabituel pour un métamoteur ; on peut ainsi restreindre la requête aux titres des pages (fonction title:), aux URLs (url:), au domaine (domain:), au serveur (host:), rechercher les pages qui pointent vers une URL donnée (link:), celles qui contiennent un mot dans le texte d’un lien (linktext:), identifier les pages similaires (related:), etc. Cela étant, les résultats sont quelquefois décevants, car tous les outils interrogés ne comprennent pas forcément ces fonctionnalités. La grille de recherche avancée de Vivisimo affiche la liste des outils interrogés et permet de sélectionner ceux de son choix, dans une limite de quinze. Les sources sont classées dans trois catégories : - les outils de recherche sur le Web : onze moteurs et annuaires généralistes sont proposés, dont Yahoo!, All the Web, Open Directory, Looksmart ... mais pas Google ! - les outils sur l’actualité : douze sources dont CNN, NYTimes, YahooNews, WorldNews, BBC, etc - les “extra search engine” : neuf sites dont l’Encyclopedia Britannica, PubMed, US Government, Patent Search et Business.com. Après avoir coché sa sélection sur un vaste tableau, l’utilisateur doit paramétrer plusieurs critères : le nombre de documents désirés (100, 200... 500), le détail de la description (résumé, URL...), le mode d’affichage (dans les fenêtres, en plein écran, dans une fenêtre séparée)... Il est possible de choisir la langue des documents sélectionnés ; l’algorithme statistique qui va classer les résultats est par définition universel ; il suffit alors de changer la liste des mots vides. Cependant, prudemment, il nous est dit que Vivisimo est pour le moment optimisé pour l’anglais, mais que cela viendra bientôt pour les autres langues. Le temps accordé à la recherche peut enfin être précisé (2, 3 secondes...). Là encore, Vivisimo prévient sagement que si le nombre de réponses est insuffisant, il faut augmenter la durée d’exploration. Un dernier point, assez étonnant dans ce type de moteur : un filtre vous permet d’éliminer tout ce qui est licencieux. Nous avouons n’avoir pas fait de test pour voir comment Vivisimo différenciait automatiquement l’érotique du porno... LE CLASSEMENT DES RESULTATSDans son autodescription, Vivisimo renouvelle un peu — avec les clusters et la classification automatique — l’idée du push, découverte soi-disant récente. Cela fait trente ans que l’on applique ce type d’algorithme à des textes, mais il faut reconnaître que des ordinateurs moins puissants ne permettaient pas de traiter des matrices de la taille de celles que traite Vivisimo, et que son algorithme est particulièrement performant. C’est en fonction des caractéristiques statistico-sémantiques que l’ensemble obtenu est divisé en différents groupes (ou clusters) par l’algorithme heuristique de classification hiérarchique mis au point par Vivisimo — Verrez-vous avec joie ou tristesse que le Chief Scientist & Co-founder, cité immédiatement après le PDG, soit de l’Ecole Normale Supérieure, a fait sa thèse de mathématiques à Paris III et sa maîtrise en Sciences Cognitive à la Sorbonne ? —. Contrairement aux algorithmes utilisés par la plupart des outils qui font de la classification automatique, l’algorithme de Vivisimo regroupe les documents en clusters et leur attribue un nom, uniquement en fonction des caractéristiques du groupe. Sur le plan pratique, l’écran de résultats affiche dans sa partie centrale la liste des pages sélectionnées, avec pour chacune son titre, un bref résumé, l’URL et les moteurs qui l’ont identifiée. Option intéressante, un lien “Preview” permet d’afficher un aperçu de la page dans la liste de résultats, évitant ainsi les incessants allers-retours. Une colonne sur la gauche liste les catégories définies par statistique, avec leur nombre de documents. Un clic sur une catégorie affiche la liste des résultats dans la partie centrale. On peut bien sûr accéder au texte intégral des pages sélectionnées. En haut de la page de résultats, le lien Details affiche un tableau qui précise le nombre total de pages identifiées dans les délais prescrits, la durée de l’interrogation, celle de la formation des clusters et le nombre de doublons éliminés. Pour chaque moteur ou site interrogé, il indique ensuite le nombre de documents retrouvés et le nombre de doublons. Une colonne “Warnings” signale les moteurs qui n’ont pas répondu dans les délais impartis et ceux qui n’ont pas compris la requête. L’utilisateur averti peut alors, selon l’importance qu’il attache à un moteur resté muet, modifier sa requête ou augmenter la durée de la recherche. Les tests faits dans divers domaines montrent une interrogation simple, des résultats rapidissimes, une navigation aisée dans les pages de résultats. En terme de pertinence, “l’autoclustering” fournit indiscutablement des indications et des orientations précieuses à celui qui n’est pas familier d’un domaine ; il peut aussi être très utile à l’expert, qui éliminera les corrélations inintéressantes et/ou évidentes, mais pourra trouver quelques clusters lui donnant des orientations auxquelles il n’aurait pas pensé. En conclusion, Vivisimo peut être considéré actuellement comme l’un des meilleurs métamoteurs présents sur le marché. Ce n’est pas un hasard s’il a obtenu la médaille d’or du “Best Meta Search Engine”, décernée par Search Engine Watch. Dépêchez-vous de l’utiliser tant qu’il est encore gratuit. |
|