Netsources, Numéro de Septembre-Octobre 2005 - n°58


Peut-on vivre sans Google ?

Très loin devant Yahoo!, Voila, MSN et AOL, Google est le moteur de recherche le plus utilisé par les internautes en France, où il génère 80 % du trafic engendré par les outils de recherche(1).
Au fil des années, Google a conquis une position dominante et propose de plus en plus de services annexes.

Auteur : Danielle Kaminsky

Une évolution qui suscite interrogations et inquiétudes, d’où le thème “L’avenir de la recherche d’information sur le Web : Peut-on vivre sans Google ?” choisi par l’association DocForum pour sa journée d’étude(2).

Où va Google ? Que nous apporte Google ? Peut-on vivre sans Google ? Quelles sont les grandes tendances de la recherche d’information en 2005 ? Qui peut concurrencer Google ? Telles étaient les thématiques du débat animé par Olivier Andrieu, éditeur du site Abondance.com et des lettres Actu-Moteur et Recherche et Référencement et co-créateur du moteur Mozbot.fr(3).

Saluant d’abord l’apport immense des moteurs de recherche pour nous faire accéder à des informations, tous les intervenants se sont accordés pour estimer que Google renforcera sa stratégie commerciale, au détriment de son cœur de métier initial, la recherche d’informations.
Dans leurs interventions, la plupart des orateurs ont souhaité mettre l’accent sur les risques d’atteinte à la vie privée des internautes, tandis qu’ils ont exprimé une vision relativement optimiste sur le futur de la recherche d’information, en montrant qu’il y avait encore beaucoup à faire dans le domaine.

Pour Jean Véronis, professeur de linguistique et informatique à l’Université de Provence(4), l’actuelle position dominante de Google est inquiétante, mais il ne gage pas qu’elle soit définitive.

Il y a quelques années, c’était ainsi AltaVista qui était l’outil de pointe, avant d’être supplanté et de dégringoler dans le classement des moteurs de recherche les plus utilisés. Qui aurait pu alors prévoir l’arrivée de Google et son ascension ?

Ce constat invite à considérer que Google pourrait à son tour être surpassé et Jean Véronis estime que la concurrence la plus sérieuse peut provenir de Microsoft, avis partagé par la plupart des autres intervenants de la journée.

Jean Véronis déplore par ailleurs que l’accès à l’information mondiale se fasse à travers des technologies dont les leaders sont tous américains. Le risque tient aussi bien à la question du filtrage des informations accessibles, qu’à celui du respect de la vie privée. Pour exemple, le filtrage de l’accès à certains sites et à certaines informations est une possibilité donnée par le Patriot Act, promulgué à la suite des attentats du 11 septembre 2001 aux Etats-Unis. Jean Véronis rappelle ainsi la différence essentielle entre les deux continents : “nous n’avons pas la même vision de la vie privée en Europe et aux Etats-Unis, ni le même modèle de société. Le respect de la vie privée, essayons de le préserver”. Il est rejoint sur ce point par la plupart des intervenants ; le risque d’atteinte à la vie privée des internautes est en fait le sujet de préoccupation qui a pris une place centrale au cours des débats de cette journée d’étude.

“J’ai l’impression que Google me connaît mieux que moi-même”


Jérôme Charron est le créateur de la liste de discussion sur les moteurs de recherche Motrech(5) et l’initiateur du groupe de travail francophone sur le moteur de recherche open source Nutch. Pour lui,  la question de savoir où va Google et à quoi il va servir dans quelques années attire une sombre réponse : davantage de traçage de l’internaute et d’addiction à Google, grâce à une multiplication de services.

Le moteur de Google n’a pas tellement changé en deux ans, affirme-t-il et il ne faut pas s’attendre à ce qu’il change beaucoup. Pour lui, le but de Google est de “tracer” les internautes : “J’ai toujours aimé Google, mais je me sens traqué. J’ai beau désactiver l’historique, même si je le fais, Google me suit toujours. J’ai l’impression que Google me connaît mieux que moi-même, puisque je n’ai pas de recul sur mes propres données. Eux, oui. Ils connaissent toutes mes relations avec Gmail, mes activités avec le traçage de mes recherches sur le Web, ils savent qui vient sur mon blog et bientôt il y aura Gcalendar. Avec Gspot wifi, je serai localisé géographiquement et cela permettra de m’envoyer de la publicité ciblée localement, en fonction du lieu où Google saura que je me trouve. Je crains pour ma liberté individuelle, non seulement en raison du traçage de mes informations personnelles, mais aussi car j’ai peur de devenir “Google addicted”.

Franck Poisson, ancien directeur de Google France et depuis novembre 2005 Directeur du Portal and Web Business Development chez Exalead(6), rappelle que le revenu de Google – comme des principaux moteurs – repose sur la vente de publicités et que son objectif est de servir à l’internaute une publicité contextualisée, au plus près de ses centres d’intérêts. Ce qui suppose de deviner les attentes du consommateur.

Ce modèle économique reposant sur le profilage des consommateurs, il craint – tout comme la majorité des intervenants – une atteinte à la vie privée ; mais n’est-ce pas le prix à payer pour bénéficier de bons outils gratuits ? se sont demandés des participants dans la salle...

Google a modifié notre rapport au surf, en créant une interface homme-connaissance assure Franck Poisson, qui pense qu’à l’avenir, Google va devenir une marque déposée de plate-forme Web – “webstop” –, une interface où l’ordinateur local ne servira qu’à accéder à des ressources éparses distantes, configuration qu’il nomme “IUI  : interface utilisateur information”.
 

“Je travaille davantage sur des sortes de mers intérieures plutôt que sur le grand magma du Web”


La consultante Armelle Thomas, qui édite notamment le blog Outils de Veille(7), indique que l’année 2005 confirme des tendances déjà identifiées : une masse de plus en plus importante d’informations à notre disposition, des index qui atteignent des tailles gigantesques – près de vingt milliards de pages pour Google et Yahoo! –,  de nouvelles pages prises en compte très rapidement par les moteurs de recherche, une indexation effectuée de plus en plus en profondeur, etc. Mais chercher des informations requiert un effort intellectuel plus important et nécessite de développer une stratégie.

Et puis il y a le développement des blogs. Rien que sur Skyrock, il y a environ trois millions de blogs rappelle-t-elle, soulignant que la popularité des blogs est évidente, car elle permet de partager entre internautes. Pour moi explique-t-elle, il est intéressant de voir ce que font les communautés d’internautes dans tel ou tel domaine. Le fil  RSS (Really Simple Syndication) devient un nouveau mode de consommation d’informations, cela change la manière de faire de la recherche.
“Entre les outils d’alerte et les résultats RSS, je me rends compte que je navigue peu sur le Web. Je travaille davantage sur des sources préalablement identifiées, des sortes de “mers intérieures” au lieu du grand magma du Web.”
La personnalisation se sophistique ajoute-t-elle, avec des outils en ligne tels que myYahoo! ou d’autres logiciels, qui permettent de garder l’historique de ses recherches.

Il ne faut pas oublier pour autant les nouveaux outils qui font leur apparition.

Ainsi, Sébastien Billard (Référencement, Design et Cie)(8), apprécie le lancement de moteurs spécialisés, qui permettent de faire des recherches précises dans les blogs et fils RSS, tels Technorati, Blogdigger, Feedster, ou encore Blinkx ou Truveo, qui aident à localiser des fichiers video et audio.

Fabrice Lacroix, qui a créé Antidot, une entreprise spécialisée sur la recherche d’information et les moteurs(9), mise quant à lui sur les mérites des moteurs sectoriels et des moteurs thématiques. Les moteurs sectoriels essaient d’aller plus en profondeur, d’ajouter d’autres documents à mettre en relation et peuvent être plus exhaustifs. Il a cité à titre d’exemple une requête qui génère beaucoup de bruit sur les moteurs généralistes et qui peut en revanche être traitée de façon pertinente avec des outils spécialisés : rechercher les possibilités de séjour de trois jours à Dijon.

Mais le bon outil ne sera pas forcément pertinent, si la question est mal posée.

Olivier Andrieu constate qu’il y a un “chaînon manquant” entre le cerveau de l’utilisateur et l’expression de la requête. “C’est très dur de comprendre ce que l’utilisateur a cherché en voyant les mots-clés qu’il utilise, dit-il. Ce n’est pas nécessairement de sa faute, car c’est difficile de trouver les bons mots-clés. Même moi, quand je cherche des informations, je m’y reprends à plusieurs fois pour reformuler la requête.”

Armelle Thomas pense qu’il faut enseigner la recherche d’information. Une matière à débat pour Olivier Andrieu, qui demande si c’est l’outil qui doit s’adapter à l’utilisateur ou l’inverse.

Mais une “mauvaise” formulation peut aboutir à des résultats très éloignés de ce que l’on recherche ; Jean Véronis le démontre en citant des exemples de recherches banales sur Google, pour lesquelles s’affichent des liens sponsorisés plus que tendancieux... A son avis, le problème du langage a été sous-estimé. La catégorisation mériterait d’être affinée et il faudrait essayer de “désambiguïser” les termes et expressions, poursuit-il.

L’analyse globale de sites serait intéressante à réaliser. Actuellement, le classement est fait sur la base de la popularité. Il est étrange observe-t-il, de retrouver dans Google News des sources qui ne sont pas des news. Il faudrait aussi travailler sur le multilinguisme, car il ne faut pas oublier que 35% des internautes ne parlent pas anglais. La traduction automatique, qui était au début de l’informatique l’une des premières applications prévues de l’ordinateur, est loin d’avoir atteint le meilleur, déclare-t-il. Pouvoir lire les résultats dans une autre langue que celle dans laquelle ils ont été créés sera une véritable avancée. Tapez le mot “lapin” dans Yahoo! en cochant la recherche multilingue et voyez : les résultats sont insensés. 

Alors, quel moteur pour demain ?
Pour Armelle Thomas, le moteur idéal serait un moteur qui cherche à comprendre en amont le besoin de l’internaute, sans trop vouloir en savoir sur lui. Un moteur qui propose différents accès à l’information, dans différents fonds, qui puisse offrir d’autres ressources, des répertoires de bases de données. Elle souhaiterait également un moteur de recherche qui puisse dater les documents et faire savoir qui édite : une administration, une entreprise, un individu. Un moteur qui puisse prendre en compte le poids que l’on souhaite donner à tel critère de pertinence et un moteur qui profite des savoirs de la communauté.

Bref, un moteur qui dépasserait son cadre de simple recherche pour proposer des sous-outils, permettant de stocker et partager les données.

La conclusion de la journée revient à Olivier Andrieu : “Je suis passé par tous les états dans cette journée. Je me demandais ce matin s’il fallait continuer de faire des recherches avec Google, eu égard à son côté Big Brother et cette après-midi, on a assisté à un foisonnement d’idées pour améliorer les outils et l’on a vu qu’en terme d’hégémonie, rien n’est joué.
Il y a 13 ans que suis dans la recherche d’information et je suis sûr que l’on n’en est pas encore aujourd’hui à 10% de ce qu’on peut faire dans le domaine”.
_________________________________

(1) Baromètre octobre 2005 de Xiti /1ère Position : www.secrets2moteurs.com/ barometre2005-10.html
(2) Association DocForum : www.docforum.tm.fr
(3) Olivier Andrieu : www.abondance.com et http://blog.abondance.com/
(4) Jean Véronis : www.up.univ-mrs.fr/veronis/ et http://aixtal.blogspot.com/
(5) Jérôme Charron : http://motrech.blogspot.com/ et http://motrech.blogspot.com/2005/10/vivre-sans-google.html
(6) Franck Poisson : http://franckpoisson.blogs.com/blogapart/
(7) Armelle Thomas : www.inforizon.com et http://inforizon.blogs.com
(8) Sébastien Billard : http://s.billard.free.fr/referencement/ et http://s.billard.free.fr/referencement/index.php?2005/10/12/153-petit-compte-rendu-de-la-journee-peut-on-vivre-sans-google
(9) Fabrice Lacroix : www.antidot.net 



Olivier Ertzscheid : de la dérive des continents
à la confusion des pratiques


Olivier Ertzscheid est Maître de conférences en Sciences de l’information à l’Université de Nantes (IUT de la Roche-sur-Yon). Il a mis en place le weblog du réseau Urfist(1) avant d’éditer son propre blog : www.affordance.info.

N’ayant pu se rendre à la journée DocForum, Olivier Ertzscheid a tenu à nous livrer sa réflexion : une mise en garde sur un mélange des genres inédit, provenant du fait que toutes les sphères d’informations sont désormais rapprochées, indexables et rendues accessibles depuis une même interface, à l’aide d’outils mis à disposition par les grands moteurs de recherche(2).

Pour lui, cette évolution entraîne le risque de voir bientôt se dissoudre l’espace privé de nos données.
Les informations contenues dans nos ordinateurs locaux sont à présent indexables par les moteurs de recherche (notamment grâce aux outils de type Desktop Search(3)), mais elles peuvent aussi être délocalisées dans les espaces procurés sur des serveurs externes, jusqu’à faire disparaître un jour nos disques durs. Une perspective qu’il a déjà exprimée de manière truculente mais néanmoins grave et lucide(4) et qui soulève la nécessité d’une réflexion approfondie sur les effets du rapprochement entre espaces d’informations publics et espaces privés sur nos processus cognitifs.

Olivier Ertzscheid compare ainsi la mise en relation de gisements d’informations jadis distincts (sphère publique, sphère privée) à une forme de “dérive des continents” propice à générer une confusion des pratiques informationnelles.

S’il rejoint les différents intervenants de la journée DocForum pour attribuer cette évolution à une stratégie visant à mieux connaître les internautes, afin de rentabiliser l’exploitation commerciale de leurs profils, il est le seul à soulever la problématique des retombées possibles sur nos pratiques informationnelles.

Interrogé par Netsources, Olivier Ertzscheid explique : Les pratiques informationnelles font appel à des processus cognitifs, ou autrement dit, à des manières d'appréhender l'information, totalement différent(e)s. Les aspects négatifs de la fusion des différents espaces d’information sont à son avis les suivants :

• en terme de pédagogie de l'information : les espaces étant de plus en plus indistincts, il devient de plus en plus difficile d'évaluer et/ou d'authentifier les informations affichées ou recherchées ;

• en terme d'ergonomie cognitive : les manières de naviguer, les points sur lesquels se portent nos regards, les réflexes cognitifs invoqués pour accéder à l'information et pour la décrypter, ne sont pas les mêmes selon que l'on échange des courriers électroniques avec des amis ou que l’on mène une tâche de recherche avancée sur une thématique précise ;

• en terme d'écologie informationnelle : devant la monétisation outrancière de l'ensemble des services proposés aux utilisateurs par les trois grands (Google, Yahoo!, MSN), l'affichage de publicités n'a pas le même sens ni les mêmes résonances quand celles-ci prennent place suite à une requête lancée dans un espace de recherche ou à droite d'un courrier électronique personnel ;

• en terme de pratiques communautaires : le risque est d'enfermer dans “leur” monde informationnel  outrancièrement sponsorisé (MyWeb de Yahoo! par exemple) des personnes arrivant sur le Net et qui – sous réserve que ces services atteignent une masse critique suffisante – ne bénéficieront plus de “l'ouverture” liée à un certain bruit informationnel.

Tout cela n'est pas nécessairement gênant pour les chercheurs avancés ou les professionnels de l'information. Ce "continent informationnel unique" rassemblant des pratiques de nature profondément hétérogènes peut même accroître (par exemple) les chances de sérendipité ; il peut permettre de mettre au jour de nouveaux croisements inédits entre des sources autrefois distinctes, il peut également renforcer l'expertise de communautés d'intérêt. C'est en revanche pour les utilisateurs “non-experts” que cette confusion des pratiques peut devenir gênante.

Propos recueillis par Danielle Kaminsky

(1) Urfist : Unité régionale de formation à l'information scientifique et technique. www.urfist.info
(2) http://affordance.typepad.com/mon_weblog/2005/10/jai_vcu_sans_go.html
(3) Lire à ce sujet “Desktop Search : voyagez au cœur de votre ordinateur”, Netsources n°56  
(4) http://www.lemonde.fr/web/article/0,1-0@2-3232,36-640948,0.html