Netsources, Numéro de Septembre-Octobre 2004 - n°52


De nouveaux axes de développement pour les moteurs de recherche

Auteur : Béatrice Foenix-Riou

Les internautes ont été témoins ces dernières années d’une guerre incessante entre les moteurs, cherchant à détenir la palme du “moteur ayant l’index le plus important” (voir Netsources n°45). Après plusieurs échappées d’AlltheWeb en tête du peloton, Google a cependant gagné en août 2003 la place de leader et ne l’a plus quittée. Le lancement de la nouvelle plate-forme Yahoo! Search Technology le 18 février dernier n’y a rien changé... Depuis son lancement, Yahoo! annonce “environ” quatre milliards de pages, quand Google reste figé à  4,28 milliards de pages...

Tout laisse à penser que la guerre des index n’est plus à l’ordre du jour et d’aucuns semblent même croire que celui de Google a atteint ses limites en terme de volume*...

C’est sur d’autres fronts que se mènent aujourd’hui les batailles et, en particulier, autour de deux axes principaux : la géolocalisation et la personnalisation.

Géolocalisation : nouvel eldorado des moteurs


Le principe de la géolocalisation consiste à identifier l’emplacement géographique de l’internaute, afin de lui fournir des informations locales le concernant spécifiquement. L’objectif est de lui permettre de retrouver plus facilement les coordonnées d’un professionnel proche de chez lui (y compris et surtout les petites et très petites entreprises) et de lui offrir en complément des services comme carte, itinéraire routier etc., sans oublier, bien évidemment, des liens sponsorisés ciblés...

Google et Yahoo! ont ainsi lancé il y a quelques mois des services en version beta,  
réservés pour le moment aux seuls internautes des Etats-Unis et – pour Google uniquement – du Canada. Mais Yahoo! a au final devancé son rival en annonçant en octobre le lancement de la version officielle de Yahoo! Local (http://local.yahoo.com).

Des tests sur les deux versions confirment l’avance de Yahoo! : les réponses sont plus pertinentes et les options sont plus nombreuses, même si les services offerts sont relativement similaires, à savoir :

- la visualisation des résultats sur une carte : si l’on lance par exemple une requête avec les mots “museums” et “san francisco”, on obtient sur Yahoo! une liste classique de résultats présentée sous forme de listing ; mais un clic sur l’icône “View results on Map” affiche un très utile plan de la ville, avec la localisation de chaque musée identifiée. Sur Google, la carte s’affiche automatiquement, sur la droite de la liste des résultats ;

- après l’affichage de la carte sur Yahoo!, la fonction Map Nearby permet de relancer une recherche sur un autre thème (par exemple restaurants) ; les résultats des deux recherches (museums et restaurants) seront présentés sur la même carte, de façon distincte ;

- sur Yahoo! comme sur Google, il est possible d’affiner la requête, en limitant le périmètre géographique de localisation : 1 mile, 10 miles, 50 miles...

- sur Yahoo!, on peut également affiner la requête avec des critères comme Category (les rubriques de Yahoo!) et, selon les thèmes, Rating (pour lire par exemple des avis d’experts et d’internautes sur les restaurants sélectionnés), Price ou encore Atmosphere (pour les restaurants par exemple : family friendly, casual, romantic...).

Les informations offertes par ces deux versions Local sont issues en bonne partie des annuaires Yellow Pages, ainsi que des propres index des moteurs, de l’annuaire Yahoo! pour Yahoo! Local et de divers partenariats.

Si ces services peuvent être utiles aux internautes désirant découvrir une ville ou à la recherche de commerces de proximité, ils représentent un enjeu capital pour les moteurs.

Avec de tels services, les moteurs prennent pied en effet sur le marché gigantesque des petites – et très petites – entreprises, susceptibles d’entrer dans la grande famille des annonceurs...
Or, selon le cabinet d’analyse Kelsey Group, si le marché de la publicité locale est évalué aux Etats-Unis à 22 milliards de dollars, 7% seulement de ce montant est issu de la publicité sur Internet...

En offrant aux PME et TPE la possibilité d’insérer des liens sponsorisés selon les requêtes et l’origine géographique des internautes, Yahoo! et Google comptent capter une part significative du marché de la publicité de proximité.

Ils seront alors en concurrence frontale avec les éditeurs d’annuaires professionnels, comme les Pages Jaunes de France Telecom en France...

Personnaliser les résultats pour fidéliser les utilisateurs


Au-delà des options proposées par quelques moteurs pour permettre aux internautes de “personnaliser” leur interface – en choisissant les couleurs, la langue, le nombre de résultats par page... –, le chantier de la “personnalisation” sur lequel travaillent de nombreux outils concerne plus spécialement le classement des résultats, qui prend alors en compte les préférences de l’internaute, en fonction de recherches précédemment effectuées ou d’informations qu’il aura fournies.

De nouveaux outils ont ainsi fait leur apparition et se distinguent par leurs options de personnalisation.
Ujiko par exemple (www.ujiko.com, voir Netsources n°50) propose à l’utilisateur d’indiquer, depuis la liste des résultats, les sites qu’il préfère et ceux qui lui déplaisent et prend ces données en compte lors de requêtes ultérieures. Eurekster quant à lui  (www.eurekster.com) se souvient des recherches effectuées et des liens cliqués et utilise ces données pour classer les réponses. Un internaute habitué des recherches juridiques obtiendra donc des pages concernant les cabinets d’avocats classées avant celles relatives au fruit, lors d’une recherche sur le mot-clé “avocat”...

Bien sûr, les nouveaux outils ne sont pas les seuls à s’intéresser à la personnalisation. Google a ainsi lancé en mars dernier, dans ses laboratoires (http://labs.google. com/personalized), un service de recherche personnalisée en version beta qui prend en compte les centres d’intérêt de l’internaute (voir Netsources n°51). Celui-ci remplit un profil en indiquant ses sujets préférés et ces données sont utilisées pour le classement des résultats. S’il était possible de préciser le “degré de personnalisation” que l’on souhaitait, la logique du système semblait assez floue et les résultats nous avait laissés sceptiques...
AskJeeves vient pour sa part de lancer My AskJeeves (http://myjeeves.ask.com), qui offre à l’utilisateur la possibilité de sauvegarder certains résultats identifiés lors de recherches, de les classer par catégories, de les annoter, etc.

Mais c’est sans doute Yahoo! qui propose l’un des services les plus complets, avec My Yahoo! Search, dévoilé début octobre.
L’objectif de ce service – en version beta – est d’aider les internautes à retrouver, à gérer et à partager les résultats de leurs recherches sur le Web.
Pour en bénéficier, il faut tout d’abord s’inscrire (gratuitement) comme utilisateur de Yahoo!. On peut ensuite se connecter à l’interface My Yahoo! Search – depuis un lien proposé sur l’interface search.yahoo.com, ou directement à l’adresse http://mysearch.yahoo.com – et lancer une recherche par mots sur l’index de pages Web de Yahoo!.

La page de résultats est similaire à celle que l’on obtient via l’accès traditionnel, à ceci près que plusieurs options supplémentaires figurent sous chaque page identifiée :
- Save permet d’enregistrer une page dans My Web, qui constituera en fait le propre index de l’utilisateur ;
- Save with Note offre de sauvegarder une page en l’annotant. On peut à tout moment ajouter une annotation à une page déjà sauvegardée ;
- Block Site propose d’exclure de recherches ultérieures certaines pages, issues par exemple de sites que l’on juge non pertinents ;
- Share propose de partager un résultat, en l’envoyant par exemple par e-mail à un destinataire.

Dans le haut de l’écran, l’onglet My Web enfin regroupe tous les résultats sauvegardés. On peut lancer des recherches sur leurs contenus, les classer par catégories (en éditant ses propres catégories), les annoter, les partager, ou encore les trier par titre, date de la recherche, URL mais aussi stratégie (How I found it).

Enfin, prouvant ainsi qu’il n’ignore pas que d’autres moteurs ont la préférence de nombreux internautes, My Yahoo! peut être utilisé pour sauvegarder des pages identifiées avec d’autres outils de recherche...
Il faut pour cela, depuis la page d’accueil de My Yahoo! Search, cliquer sur l’option “Install the My Yahoo! Search button to save pages anywhere on the Web”. Un simple “glisser/déposer” permet ensuite d’installer le bouton “Save to Y! My Web” dans sa barre des favoris (sur les navigateurs IE, Mozilla/ Netscape, Safari...).
Et il suffit alors de cliquer sur ce bouton – lors de recherches sur Google par exemple –, pour sauvegarder dans My Web la liste des résultats de Google, ou une des pages identifiées, avec des annotations éventuelles.

En définitive, les internautes rencontrent fréquemment, lorsqu’ils dépouillent les résultats obtenus sur un moteur, des pages pour lesquelles ils se disent “très intéressant.. il faudra que j’y revienne après” ... My Yahoo! Search offre un moyen simple de conserver aisément les pages dignes d’intérêt et constitue en tout cas un bel outil de fidélisation...

Google Print : quand le moteur met des livres dans son index...


En décembre 2003, Google avait lancé très discrètement une version beta d’un service nommé Google Print. Ce dernier permettait d’obtenir, lors de recherches sur le moteur, des informations tirées de livres – résumé de  l’ouvrage, biographie de l’auteur... – qui se distinguaient par la mention [book beta] devant le lien. A l’occasion de la foire du livre de Francfort, en octobre dernier, Google a annoncé le lancement officiel du programme Google Print, qui devrait néanmoins connaître des évolutions dans les mois qui viennent. Le principe de Google Print est simple : le moteur invite les éditeurs à lui fournir des ouvrages (ils doivent impérativement – pour le moment du moins – être de langue anglaise et avoir un numéro ISBN) et les scanne dans leur intégralité.

Dans le cadre de ce programme, l’internaute peut obtenir en tête de résultats, lors de recherches par mots sur le moteur, une rubrique “Book results for ...” avec les titres de quelques ouvrages, suivis du nom de leur auteur et de leur nombre de pages.
En cliquant sur le titre, on affiche le texte intégral de la page pertinente et l’on peut consulter les deux pages suivantes/précédentes, identifier les autres pages pertinentes, obtenir la table des matières et bien sûr commander le livre en ligne auprès de différents revendeurs (Amazon.com, Froogle...).

Pour le moment, les livres identifiés n’apparaissent que depuis l’interface internationale ; lors de nos tests, seuls trois titres étaient proposés et n’apparaissaient pas systématiquement selon l’ordre des termes de la recherche (on obtient par exemple trois titres à la question book internet "search engines", mais aucun ne s’affichent pour la requête internet "search engines" book...).

En complément des livres, le programme Google Print indexe également le texte intégral d’articles, accessibles ensuite sur le site de l’éditeur. Ces derniers se distinguent par la mention [magazine] devant chaque lien.
Contrairement aux livres, on peut les rechercher spécifiquement avec une requête comme “search engines” site:print. google.com inurl:articleid (chaque article est en effet identifié par un code).

Si Google Print ne peut qu’enrichir le contenu du moteur, son volume est pour le moment bien en deça de celui de sites similaires. Avec son service Search inside the book, Amazon.com permet ainsi de lancer des requêtes sur 33 millions de pages, issues d’environ 120 000 livres ; quant à FindArticles.com, proposé par LookSmart, il  propose le texte intégral de 5,5 millions d’articles issus de 900 publications....


*On pourra lire à ce sujet l’article de Daniel Brandt “Is Google broken? It's behaving as if it has a Y2K+3 problem”, June 9, 2003,www.google-watch.org/broken.html, ainsi que les nombreuses discussions qui ont eu lieu à ce propos dans les forums.