Netsources, Numéro de Mars-Avril 2006 - n°61


Hakia.com, le moteur qui vous comprend

Localisée à New York, la société Hakia a été fondée en 2004 et s’est fixé pour but de développer un moteur de recherche “révolutionnaire”, basé sur le sens et comprenant le langage naturel. ...

Auteur : Jennifer Clerté

Le moteur éponyme a été lancé au début du mois d’avril 2006. Son écran d’accueil en fait un clône de Google et l’on se demande ce que peut proposer de bien nouveau cet outil, quand les concepteurs affirment qu’ils ont eu pour but de concevoir “un monstre informatique qui connaît tout”. C’est en lisant la présentation des technologies utilisées dans le développement du produit que l’on commence à soupçonner certaines originalités dans son fonctionnement.

Tout en utilisant, comme les autres moteurs, un crawler qui indexe les pages Web, Hakia fonctionne selon un algorithme de compréhension basé sur quatre principes :
- analyse sémantique : un système propriétaire baptisé MAQ analyse le sens des pages indexées ;
- système ontologique : cette fonction confère à l’outil la faculté de comprendre le langage naturel et de saisir le sens d’un texte. Ainsi, Hakia peut identifier une page indiquant par exemple que “l’Aspirine est un traitement contre la migraine” en réponse à la question “Quels médicaments traitent les maux de tête”, alors que les mots aspirine et migraine ne figurent pas dans la question.
- logique floue : grâce à une méthode de raisonnement approximatif, le système sémantique est rendu plus souple, malgré un cadre technique assez contraignant ;
- évolution des connaissances : les connaissances du moteur s’enrichissent à chaque requête effectuée par les internautes.
Cette description restant néanmoins quelque peu absconse et permettant difficilement d’évaluer les performances et l’originalité de cet outil, il nous faut le tester…

HAKIA : MODE D’EMPLOI


Première nouveauté : le champ de requête disponible en page d’accueil propose de saisir non seulement des mots-clés ou une expression, mais également une phrase ou encore une question.
On remarque d’ailleurs que le bouton permettant d’exécuter la recherche n’est pas intitulé Search mais Ask, ce qui sous-entend que l’outil comprend la question que vous lui soumettez.

Après avoir lancé une requête, on obtient une page de résultats qui semble au premier abord “classique” ; elle affiche les dix premières pages identifiées avec, pour chacune, son titre (assorti d’un lien hypertexte), un extrait de la page au sein duquel est surlignée la phrase considérée comme répondant à la question posée et enfin l’URL.

Mais l’on remarque vite plusieurs différences avec ce que l’on trouve habituellement sur les moteurs :

- il n’y a aucune indication sur le nombre de documents trouvés.
Dans sa présentation, Hakia indique en fait que, contrairement à ce que l’on a pu penser jusqu’ici, ce n’est pas le nombre de pages identifiées pour une requête qui compte, mais plutôt le nombre de “connaissances” contenues dans ces pages qui importe réellement.
On trouve donc, en haut de la page de résultats, un diagramme qui indique “l’évolution des connaissances” de Hakia, c’est-à-dire le pourcentage des connaissances contenues sur le Web visible, déjà indexées par le moteur. Hakia annonce aujourd’hui couvrir 25% des connaissances, et compte atteindre les 100% d’ici l’automne 2006 ;

- en haut de la page de résultats, dans un encadré pastel, on trouve souvent un “avis” de Hakia sur la pertinence des réponses, précédé d’un dessin représentant un profil – sans nul doute celui d’un expert. Le  moteur peut ainsi demander “Not quite sure about your question. Can you ask it in a different way?”, “Tough question! See if the results below help.” ou encore “The results below seem to be relevant to your query.”
C’est au sein de cet encadré pastel que Hakia nous suggère quelquefois de consulter sa “galerie” sur le sujet, qui constitue sans doute l’un de ses principaux atouts.

UNE FONCTIONNALITE ORIGINALE : LES “GALERIES”


Pour un certain nombre de recherches assez courantes, Hakia procède à une catégorisation de l’information contenue dans les pages trouvées et classe ces dernières dans des rubriques diverses et variées selon les domaines.

A la question “What are the factors of breast cancer ?” (quels sont les facteurs favorisant le cancer du sein ?), l’avis de “l’expert” de Hakia est particulièrement intéressant.

Il souligne la pertinence de la première réponse trouvée par Hakia (“Great question !  Risk factors for Breast Cancer including risk behaviors, associated conditions, protective factors, and unrelated factors. See this page....”) et suggère d’aller visiter “hakia gallery for Breast Cancer”.
       
Cette galerie propose sur une page une sélection des résultats, classés cette fois  selon le type d’information contenu dans la page : Basic information and faq, Symptoms and diagnostics, Treatment, procedures and therapy, Latest news, Clinical trials, Healthcare facilities and finding a physician, Alternative therapies, Research and statistics, Related organizations, Message board, Images.... Une à cinq pages en moyenne sont suggérées pour chaque thème.

Bien sûr, si l’on fait une recherche sur un autre type de question, on obtient des rubriques différentes. Ainsi, pour une recherche sur Paris, Hakia propose les rubriques suivantes : Travel profile, How to get there, Local transportation, Main attractions, Neighborhoods and regions.
 
Proche du système de clusters, les galeries offrent une vision d’ensemble de l’information disponible sur un sujet et permettent d’y accéder directement sans avoir à reformuler sa question.
En fait, les thématiques proposées par Hakia sont pré-établies pour plusieurs grands domaines (médecine, tourisme, personnes célèbres…), contrairement aux clusters offerts notamment par Exalead, qui sont générés automatiquement à partir d’une analyse sémantique des pages trouvées.  Quoiqu’il en soit, cette nouvelle forme de catégorisation de l’information n’est pas sans intérêt et l’on aimerait qu’elle soit disponible sur davantage de sujets (économie, technique…).

Au total, le moteur Hakia se démarque des autres outils de recherche et offre des fonctionnalités séduisantes.
Certes, l’on aimerait en savoir plus sur certains points et notamment sur l’algorithme utilisé pour le classement des résultats.

D’autre part, la couverture du moteur est encore très partielle et, sur des sujets pointus, le nombre de réponses peut être très faible – quant aux prévisions de l’éditeur, qui annonce une indexation totale des connaissances du Web visible d’ici l’automne 2006, elles nous paraissent pour le moins ambitieuses !

Reste que Hakia est encore en version bêta et que l’outil est amené à s’enrichir. En tout état de cause, à l’heure de la “googlisation” des outils de recherche, ce moteur a le mérite de proposer une approche innovante de la recherche d’information, ce qui mérite d’être salué.

www.hakia.com