|
Netsources, Numéro de Novembre-Décembre 2005 - n°59 PolyMeta.com : les Hongrois à l'assaut du WebLe métamoteur hongrois PolyMeta a récemment fait son apparition sur le marché des outils de recherche sur Internet. “Un de plus !” aura tendance a soupirer l’internaute blasé, en retournant aussitôt vers son vieux compagnon de route, Google (à moins que l’article pp.1-6 ne l’ait convaincu d’explorer de nouveaux outils !). Un examen plus approfondi pourra cependant l’engager à revoir ses habitudes. Nous présenterons ici ce métamoteur, en le comparant à ses principaux concurrents.
|
Auteur : Jennifer Clerté |
|
PolyMeta a
été développé par la société hongroise K-Prog, jeune start-up
constituée de spécialistes en information, de linguistes et
d’informaticiens hongrois et américains. La société a d’ores et
déjà travaillé en collaboration avec des organismes réputés du
domaine de l’information et de la recherche, tels que la National
Library of Medicine, la bibliothèque en ligne the Homeland Security
Digital Library aux Etats-Unis ou l’université de Debrecen en
Hongrie, pour lesquels elle a développé des outils sur mesure.
Avec le métamoteur PolyMeta, cette société s’attaque désormais plus largement au monde du Web. L’interface de l’outil est pour le moins très classique. A l’image de Google, elle est composée d’une zone de saisie au-dessus de laquelle des onglets permettent de sélectionner un module de recherche spécifique (Web, News, Health, Images). Sous ce champ, se trouvent les sources propres à chaque module, que l’internaute peut choisir d’interroger ou non en les cochant/décochant. En y regardant de plus près, on constate que la gamme des sources proposées par PolyMeta est plus large et plus variée que celle de nombreux métamoteurs. LES SOURCES INTERROGEESCe métamoteur possède en effet deux atouts : • il permet d’interroger quatre types d’outils de recherche : des moteurs du Web, des moteurs d’actualité, certaines bases de données médicales du Web invisible gratuit et des moteurs d’images ; • il offre la possibilité d’interroger Yahoo! et surtout Google sur le Web, alors même que le leader des moteurs refuse le plus souvent les requêtes des métamoteurs. PolyMeta offre, de plus, un panel de sources assez large pour chacun de ses modules de recherche : • Web : Google, Yahoo!, MSN, AskJeeves, GigaBlast ; • News : Google News, Yahoo News, MSN News, le New York Times, US News et Topix ; • Images : Google Images, Yahoo! Images, MSN Images ; • Health : ce module constitue l’originalité de PolyMeta, qui vise ainsi plus particulièrement les professionnels de la santé. Les bases proposées sont issues du Web invisible gratuit : NLM, Yahoo! Health, Scirus, HealthMaps, PubMed, Healthfinder et Clinicaltrials.gov. PolyMeta rejoint ici le principe de GoshMe et de Profusion, qui permettent d’interroger simultanément plusieurs bases de données du Web invisible, spécialisées sur un domaine précis. Si on compare ces sources à celles de Clusty – le métamoteur lancé récemment par Vivisimo –, on regrettera que PolyMeta ne propose pas de module de recherche sur les blogs. Clusty permet en effet d’interroger simultanément quatre moteurs de blogs (Feedster, Technorati, Blogpulse et Blogdigger), mais n’interroge ni Google, ni Yahoo!, ce qui manque cruellement à ses recherches sur le Web – Clusty permet néanmoins de lancer une requête sur les actualités de Yahoo News (mais pas sur celles de Google News), ainsi que sur quelques quotidiens régionaux américains, tels que le Philadelphia Daily News ou le Charlotte Observer. KillerInfo pour sa part, qui proposait à son lancement d’interroger diverses sources dans le domaine de la santé, du business..., n’offre plus aujourd’hui qu’une recherche sur les moteurs du Web. En terme de sources interrogées, PolyMeta possède donc un atout par rapport à ses concurrents. PRESENTATION DES RESULTATSUne fois la requête lancée sur les sources de son choix, on obtient une page de résultats sobre et dénuée de liens sponsorisés – Espérons que cela puisse durer ! En haut de l’écran, PolyMeta rappelle quels ont été les moteurs ou bases interrogé(e)s et indique pour chacun(e) le nombre de résultats obtenus. Toujours au-dessus de cette liste, un menu déroulant permet de classer les résultats par pertinence (choix par défaut), par ordre alphabétique ou par source. La liste des résultats indique, pour chacun, le titre de la page suivi d’un lien Preview, qui ouvre un petit aperçu de la page au sein de la liste. Suivent un extrait pertinent, le nom des sources ayant retrouvé ce résultat – avec l’indication pour chacune du rang de classement de la page trouvée – et enfin l’adresse du site. Sur la droite de l’écran, les premières images identifiées par Google, Yahoo!... s’affichent également. Enfin, et c’est une des valeurs ajoutées de PolyMeta, ce métamoteur utilise une technologie de clustérisation et offre, dans une colonne sur la gauche, un classement des pages identifiées dans des dossiers, correspondant à des “termes associés”. DES CLUSTERS ET DES METAMOTEURSCette fonctionnalité n’est pas nouvelle puisqu’elle caractérise notamment Vivisimo et Exalead, qui comptent parmi les précurseurs dans ce domaine – Northern Light avait également en son temps développé une technologie proche. Basées essentiellement sur une analyse statistico-sémantique des pages de résultats, ces technologies permettent d’identifier “à la volée” des mots et expressions permettant d’affiner la requête. Exalead affiche ainsi une liste des mots composés qui apparaissent le plus souvent dans les pages de résultats ; en cliquant sur l’un des termes, on rajoute ce mot à l’équation de recherche et l’on obtient une nouvelle liste de résultats et une nouvelle sélection de termes associés. Vivisimo quant à lui classe les pages de résultats dans des dossiers et sous-dossiers, correspondant aux concepts-clés communs aux pages pertinentes, retrouvés dans le titre, les méta-données… La technologie de PolyMeta semble pour sa part plus proche de celle de Vivisimo, bien que nous n’ayons pas d’éléments très précis sur son mode de fonctionnement. Au regard des quelques tests effectués sur ces trois outils, nous donnons cependant notre préférence à la technologie d’Exalead. A titre d’exemple, une recherche sur le mot “pneumonie” affiche sur ces trois métamoteurs les termes associés suivants : • Exalead : Infections respiratoires ; Voies respiratoires ; Pneumonie atypique ; Mala-dies respiratoires ; Syndrome respiratoire aigu sévère ; Infections bactériennes ; Traitement antibiotique ; Virus de la grippe ; Infections virales ; Agents infectieux ; • Vivisimo : Akute oder chronische Entzündung ; Pneumonie atypique – contenant les sous-dossiers Santé, Cas, France, Vaccin, Indications de Substances, Other Topics – ; Maladies – avec les sous-dossiers Syndrome respiratoire aigu sévère, Santé, Par une bactérie, Broncho-pneumonie, Mavicanet, Other Topics – ; Pneumonia ; Pneumocystis Carinii ; Bronchitis ; Medizin ; Chlamydia information ; Pneumonies communautaires ; • PolyMeta : Pneumonie - contenant les sous-dossiers “Pneumonie atypique”, “A la pneumonie”, “Pneumonie est” – ; Est une maladie ; Agence France Presse ; Syndrome respiratoire aigu sévère ; Lungenent-zündung ; Ont été signalés ; Inflammation des poumons ; Akute oder Cronische ; Chez les enfants Bien que Vivisimo et PolyMeta aient la particularité de retrouver des concepts synonymes dans d’autres langues – ce qui peut être utile pour élargir une recherche –, on constate que les dossiers thématiques élaborés par Exalead sont plus pertinents que ceux de ses deux concurrents. Au final, PolyMeta s’avère être un outil plutôt intéressant, notamment en terme de sources proposées et de présentation des résultats. Sa technologie de clustering laisse cependant à désirer et ne parvient pas à rivaliser avec celle d’Exalead. Néanmoins, K-Prog comptant sur cette technologie pour faire de PolyMeta le leader des métamoteurs, on peut espérer des améliorations futures... |
|