|
Netsources, Numéro de Mars-Avril 2002 - n°37 Mirago France, un moteur de recherche thématique et régional |
Auteur : Olivier Andrieu |
|
Disponible depuis peu en version Beta, le moteur de recherche
Mirago au nom simple et facilement mémorisable dans toutes les
langues propose bon nombre de fonctionnalités originales.
Ce moteur a au départ été créé par la société anglaise Compsoft (www.compsoft. co.uk), spécialisée dans les bases de données depuis 1979. Par son activité, cette société a eu à traiter de nombreuses problématiques tournant autour des index de données puis, de façon naturelle, du Web. Les dirigeants ont alors eu l'idée de mettre en place un projet autour de la recherche d'information sur le Web, qui devint une extension de Compsoft, puis une entreprise à part entière en 1999. Le produit vit le jour fin 1998 en Grande-Bretagne sous la forme d'un moteur de recherche (www.mirago.co.uk/). Cet outil remportant un succès important, il fut décidé d'étendre la zone géographique cible à la France (www.mirago.fr/), à l'Espagne (es.mirago.com/) où le site est, là aussi, en version Beta pour quelques jours , et à l'Allemagne, dans les mois qui viennent. Actuellement, tous les sites sont gérés depuis le Royaume-Uni ; tous les serveurs et toutes les équipes techniques et éditoriales se trouvent dans la banlieue de Londres. Cette situation pourrait toutefois Ítre amenée à évoluer, en fonction du succès rencontré par les outils dans les pays o˘ ils s'installent actuellement, sous la forme d'une implantation, notamment commerciale. Au Royaume-Uni, le site Mirago traite actuellement 1,5 millions de requêtes par jour et compte 380 000 utilisateurs. Sa grande et principale originalité est qu'il propose trois approches différentes : globale, régionale et thématique. LA RECHERCHE GLOBALEL'index de Mirago France compte à l'heure actuelle 15 millions de pages en langue française (50 millions au Royaume-Uni et 5,5 millions en Espagne), prélevées sur 500 000 sites. Sur la page d'accueil, une interface minimaliste à la Google, propose de saisir un ou plusieurs mots-clés. L'opérateur par défaut est un ET. Un lien Plus d'options est proposé en haut à droite du formulaire de recherche. Il affiche une interface de recherche avancée originale, permettant de combiner plusieurs critères : - on peut limiter les résultats selon la date de dernière modification des documents (de 1 an à 1 mois) ; - il est bien entendu possible de chercher dans le Web de façon globale, mais également dans des index plus précis : pages avec images, avec sons, vidéo, multimédia, etc. ; - plus originale est la possibilité de classer les résultats par pertinence (tous les critères de pertinence de Mirago sont alors pris en compte : nombre d'occurrences du mot demandé dans la page, indice de popularité, etc.) ou par indice de popularité (ce critère étant strictement quantitatif pour Mirago, ce sont alors les pages Web contenant le mot demandé qui sont le plus pointées qui apparaîtront en premier). Parmi les autres possibilités, on citera le classement par nombre d'images (plus il y a d'images dans la page en question, mieux elle est classée) ou par date (les plus récentes seront affichées en premier) ; - le menu déroulant Rechercher offre pour sa part plusieurs options : le meilleur résultat (équivalent du J'ai de la chance de Google), les pages qui contiennent tous les mots, n'importe quel mot, la plupart des mots, une personne, une expression, ou les mots liés ; dans ce cas, le moteur cherche les documents dans lesquels les mots de la recherche sont proches les uns des autres, mais dans n'importe quel ordre. L'option Requête booléenne permet quant à elle d'utiliser les opérateurs booléens. Cependant, peu d'opérateurs semblent disponibles et des essais avec ET, OU, OR, SAUF n'ont pas été concluants, loin de là... Le moteur envisage de modifier les options de sa recherche booléenne ; cela explique sans doute qu'il se montre très discret et que les tests réalisés n'aient pas donné de résultats probants. En ce qui concerne la formulation de la requÍte elle-même, Mirago affirme comprendre les phrases en langage naturel (Où puis-je trouver le palmarès des Jeux Olympiques de Salt Lake City ?) et tente de répondre de la meilleure façon possible. Le logiciel interprète indifféremment les minuscules et majuscules, et ne prend pas en compte les caractères accentués ; l'ordre des mots dans la requête n'a pas d'importance. L'outil sait également détecter les pluriels et les verbes conjugués. Deux options sont enfin proposées sur la grille de recherche avancÈe, sous la forme de boîtes à cocher : Résumer les sites (si la boîte est décochée, la description textuelle du lien n'est pas proposée) et Une réponse par site (un seul lien affiché par site). LA RECHERCHE PAR REGION ET SECTEURC'est là l'une des grandes originalités de Mirago : ce moteur de recherche (et non pas cet annuaire) est également orienté sur les régions françaises et sur un certain nombre de secteurs d'activité. Un clic sur l'onglet Région de la page d'accueil offre ainsi la possibilité de mettre en place un filtre sur les 22 régions françaises, depuis l'Alsace jusqu'à Rhône-Alpes (dommage, les Dom-Tom sont oubliés, mais ils devraient être bientôt présents). Il est possible d'effectuer une recherche à partir d'une ville, d'un département ou d'une région en France. Les résultats de la recherche régionale sont ordonnés de manière à ce qu'apparaissent en premier les pages des sites situés dans la ville sélectionnée, puis les réponses départementales (c'est-à-dire les réponses d'autres villes du département), suivies des résultats régionaux (sites situés dans d'autres départements de la région). L'onglet Secteur offre quant à lui sept thématiques : Finance, Juridique, Habitat, Agroalimentaire, Médecine, Tourisme et Agriculture. Son objectif est de limiter la recherche aux pages des sites d'un domaine particulier. Exemple-type : le mot-clé sexe avec la thématique Médecine identifie à part le nom de domaine correspondant (www.sexe.com, il y a là un bug que Mirago devra corriger...) toutes les pages indexées qui ont trait au sexe, mais dans l'univers de la santé... D'autres thématiques sont prévues à moyen terme, si l'outil de recherche rencontre un franc succès en France. On notera que les modules Région et Secteur disposent d'une grille de recherche avancée, avec les mêmes fonctionnalités que celle décrite précédemment. On voit tout de suite l'intérêt d'un tel outil car, s'il est vrai que les annuaires régionaux et thématiques sont disponibles par dizaines, voire par centaines sur le Web francophone, les moteurs de recherche indexant des pages Web en langue française sont beaucoup plus rares... Comment Mirago fait-il pour régionaliser et thématiser de façon automatique les documents ?De quatre façons différentes : - lors de la soumission du site, le webmaster peut donner un certain nombre d'informations permettant de préciser la zone géographique et le domaine d'activité du site ; - des interrogations automatiques (Whois) sur les bases de données de Network Solutions et de l'Afnic donnent également de précieuses informations ; - lors du crawl du site Web, un algorithme tente de détecter une adresse postale et un nom de ville, de département ou de région dans le code des documents indexés ; - une équipe éditoriale effectue également un travail similaire à la main, classant les sites dans la région et le domaine d'activité adéquat. Bien entendu, un site peut tout à fait être enregistré dans plusieurs thématiques, voire dans plusieurs régions (cas de filiales). Au Royaume-Uni, il est même proposé un système de type latitude / longitude, qui permet d'effectuer une recherche, par exemple sur Londres ou sur les villes autour de Londres. Ce système pourrait Ítre intégré sur Mirago France dans un proche avenir. BUSINESS MODELLe site actuel est encore très jeune. Le business model de l'activité n'est pas basé sur l'affichage de publicités (aucune bannière n'est visible sur les pages de l'outil), mais sur l'achat de mots-clés aux enchères, comme le proposent Espotting, Overture ou Google Adwords Select, au CPC (Coût Par Clic). Dans ce cadre, Mirago se rapproche un peu d'un outil comme Misterbot (www.misterbot.com/), mais qui prendrait en compte son propre index (Misterbot utilisant l'annuaire Open Directory). Le système d'enchères sur les mots-clés n'est pas encore ouvert sur Mirago France. Il devrait voir le jour dans les semaines qui viennent, à la fin de la phase Beta d'expérimentation. Mirago n'écarte pas non plus l'idée de vendre sa technologie à d'autres sociétés, notamment dans le cadre de projets intranet. En revanche, la revente auprès d'autres sites des mots-clés gérés par Mirago (et achetés auprès de l'outil par des webmasters) n'est pas à l'ordre du jour. Pour l'instant, le site démarre petit à petit, sans objectifs commerciaux précis. Ceux-ci seront fixés de façon beaucoup plus avancée d'ici un mois ou deux, quand la phase Beta sera terminée et que la société aura une bonne vision du marché potentiel français. Les nouveaux projets en terme de moteurs de recherche ne sont pas légions, qui plus est sur le Web francophone. Raison de plus pour tester Mirago, qui s'annonce comme un concurrent intéressant et innovant dans la nouvelle vague menée aujourd'hui par des outils comme Exalead ou Kartoo, chacun dans des domaines différents. En tout cas, il amène sa propre dose d'innovations souvent originales et basées sur le bon sens, ce qui est un gage de succès. Bonne chance à eux ! |
|