|
Netsources, Numéro de Mai-Juin 2005 - n°56 Desktop Search : voyagez au coeur de votre ordinateurPauvre race canine ! Reconnue depuis toujours comme la meilleure amie de l’Homme, elle s’est vu détrônée par un être bien moins chaleureux mais sans doute plus fonctionnel… : l’ordinateur !
|
Auteur : Jennifer Clerté |
|
De simple outil d’archivage et de saisie, il est devenu le centre
d’un grand nombre d’activités humaines, en regroupant en un seul
point les fonctions d’analyse, d’édition, d’information, de
communication, sans parler des fonctions récréatives et éducatives.
La multiplicité des fonctions a très vite nécessité le développement de la capacité de stockage des ordinateurs, qui est passée de quelques Mo à plusieurs Go aujourd’hui. Cependant, la mise à disposition d’un espace de stockage toujours plus grand, associée à cette diversité d’usages, n’a pas que des avantages. Première conséquence de cette évolution : un chaos incommensurable ! Nos ordinateurs sont devenus de véritables bric-à-brac de documents en tout genre, à tel point que pour certains, sauvegarder un dossier revient à le jeter aux oubliettes… Trêve d’exagération, il suffit le plus souvent d’un minimum d’organisation ; on peut ainsi créer – préalablement à tout enregistrement de fichier – un dossier de sauvegarde spécifique, situé à un endroit précis de son ordinateur. Cette organisation sera néanmoins difficile à mettre en place si elle n’a pas été entreprise dès les premières utilisations de l’ordinateur et, a fortiori, lorsqu’on croule déjà sous le nombre de fichiers. Constatant cette tendance à la profusion de documents et au désordre, plusieurs types d’acteurs ont pressenti la naissance d’un nouveau marché et se sont engouffrés dans la brèche. Outre les éditeurs de systèmes d’exploitation (Apple, Microsoft) et de logiciels, les éditeurs d’outils de recherche sur le Web ont très rapidement décidé de proposer un nouveau type d’outil, permettant de retrouver tous types de fichiers enregistrés dans les ordinateurs. Trois principaux enjeux ont motivé les acteurs de la recherche sur Internet pour tenter la conquête de ce marché : - fidéliser les internautes au-delà de leur utilisation du Web ; - rivaliser avec le prochain système d’exploitation de Microsoft, Longhorn, qui devrait proposer une solution intégrée de recherche Web et PC ; - disposer d’un fichier clients toujours plus important, et multiplier ainsi la diffusion des annonces publicitaires. AltaVista ouvrit la marche et lança le premier outil de Desktop Search en février 2002. Il fut suivi notamment par Lycos (mars 2004), Copernic (août 2004), Google (octobre 2004), MSN (décembre 2004), Yahoo! (janvier 2005) et, dernier en date, Exalead (juillet 2005). Pour parvenir au développement de ces solutions, plusieurs de ces acteurs ont choisi de se rapprocher de sociétés spécialisées. Ainsi, MSN a acquis la société Lookout, qui a conçu un moteur pour rechercher dans les archives du logiciel de messagerie Outlook. Yahoo! quant à lui a racheté Stata Labs, également pour son logiciel de recherche dans les archives de messagerie ; il a en outre incorporé la technologie de la société X1 pour son propre outil de Desktop Search. Eu égard à la profusion de l’offre, nous ne présenterons ici qu’une sélection de solutions “Desktop Search”. Nous avons retenu, du fait de leur intérêt ou de la renommée de leur éditeur, Google Desktop Search, Yahoo! Desktop Search, Copernic Desktop Search et MSN Search Toolbar. CARACTERISTIQUES DES SOLUTIONSDe manière générale, on distingue deux types d’interfaces : - les interfaces logicielles, composées d’un espace de recherche plus ou moins avancé et d’un écran principal divisé en deux parties, l’une présentant la liste des résultats de la recherche (c’est-à-dire des différents documents retrouvés sur le disque de l’ordinateur), l’autre affichant un aperçu du document que l’on aura sélectionné au sein de la liste. C’est le cas notamment de Yahoo! Desktop Search et Copernic Desktop Search ; - les interfaces Web, offertes par exemple par Google et MSN. L’outil de recherche Desktop est alors simplement ajouté à l’interface classique du moteur et est accessible via un onglet supplémentaire. Dans le cas de Google, la zone de saisie est surmontée des liens Web, Images, Groupes, Actualités et Desktop, dans une interface similaire à celle de Google.fr. Quel que soit le type d’interface, leur principe de fonctionnement est identique. Après installation sur l’ordinateur, l’outil procède à l’indexation des fichiers et dossiers qui s’y trouvent. Sont pris en compte les noms de fichiers comme l’intégralité du contenu des documents indexés. Pour être totalement opérationnel, ces nouveaux logiciels doivent procéder à l’indexation complète du contenu de votre ordinateur. Selon le nombre de fichiers dont vous disposez, cette opération peut prendre plusieurs heures ; elle s’effectue lors des périodes d’inactivité de votre ordinateur, pour ne pas ralentir le système. Il est donc conseillé de laisser son ordinateur allumé durant une nuit, afin que l’indexation puisse se faire d’une seule traite et une fois pour toute. Une fois l’outil desktop search activé, la mise à jour de l’indexation se fait ensuite au fur et à mesure de la création de nouveaux fichiers. La recherche se fait donc à la fois sur le titre des documents et sur le texte qu’ils contiennent. Cette fonctionnalité s’avère à double tranchant : elle constitue en effet une avancée incontestable par rapport à l’outil actuel de recherche interne proposé par Windows, qui ne recherche que sur le titre des documents. Mais a contrario, seul Yahoo! DS permet de limiter la recherche au titre des fichiers, avec sa fonction Refine:. On risque donc parfois d’être noyé par les résultats hors-sujet. Même Google ne permet pas pour l’instant d’utiliser son opérateur intitle: pour son outil de Desktop Search… Dommage ! La liste des résultats retrouvées est également à peu près similaire d’un outil à l’autre. Pour chaque élément, elle indique le type de fichier dont il s’agit grâce à une icône spécifique (pdf, doc, html, ppt, mail….), le titre du document et son emplacement sur le disque. Yahoo DS et Google DS donnent aussi la date de création du document. Cependant, tous ces outils ne sont pas équivalents, bien au contraire ! En se penchant de plus près sur leurs fonctionnalités, on constate qu’ils se distinguent les uns des autres sur plusieurs critères permettant d’évaluer leur efficacité. TYPES DE DOCUMENTS INDEXES ET VOLUMEYahoo Desktop Search (Yahoo! DS) est sans aucun conteste en tête du palmarès, avec un total de 225 formats de fichiers indexés. Hormis les fichiers texte, les fichiers multimédias (image, audio, vidéo) ou les applications, il indexe les mails ainsi que leurs pièces jointes. Mais surtout, il est l’un des seuls outils à prendre en compte non seulement les mails de Outlook et Outlook Express, mais aussi ceux des messageries Netscape Mail ou Eudora. Google Desktop Search (Google DS), pour sa part, s’est bien rattrapé. La version bêta de son outil ne permettait que d’indexer les fichiers textes et les mails d’Outlook et de Gmail. La version finale de l’outil, lancée en mars 2005, indexe désormais aussi les fichiers multimédias audio et vidéo. Côté logiciels de messagerie, il prend en compte les emails de Mozilla Thunderbird et de Netscape. Pour les navigateurs (indexation de l’historique et des favoris), ce sont Internet Explorer, Firefox et Netscape qui sont pris en charge. Copernic Desktop Search (Copernic DS) prend lui-aussi en compte de très nombreux formats de fichiers texte (notamment les documents de Word Perfect) et multimédias (MP3, WAV…), mais n’indexe que les messages d’Outlook et Outlook Express et l’historique des pages Web d’Internet Explorer. MSN Search Toolbar est sans doute le moins performant de cette sélection d’outils, en terme de variété de fichiers indexés. En effet, en dehors de fichiers relatifs aux applications de Windows, le Desktop Search de MSN indexe assez peu de documents et donne peu d’informations sur les formats effectivement indexés ou non. A priori, les fichiers de Wordperfect, concurrent de Word, ne sont pas indexés et, plus grave, il faut avoir recours à un plug-in spécial pour pouvoir indexer les fichiers PDF. Enfin, MSN ne propose pas d’indexation de l’historique des pages Web consultées, sous prétexte de respecter la confidentialité. On aurait cependant apprécié qu’il nous laisse la possibilité de choisir, comme le font les autres outils. Il en résulte un volume de documents indexés très différents d’un outil à l’autre. Quelques tests sur l’une de nos machines nous ont permis de constater cette corrélation entre la variété des formats de fichiers pris en compte et le nombre de documents indexés pour chaque outil. Ainsi, Yahoo DS se retrouve largement en tête avec plus de 61 562 éléments indexés. On retrouve loin derrière Google DS avec plus de 28 874 éléments indexés, MSN Search Toolbar avec 19 858 éléments et Copernic DS avec 19 713 éléments. Attention ! Pour que ces tests soient représentatifs, il faut tout d’abord vérifier que chacun des outils procède à l’exploration des mêmes disques et dossiers de l’ordinateur. FONCTIONNALITES DE RECHERCHEL’efficacité de ces outils est bien évidemment liée à la taille du corpus qu’ils sont capables d’explorer, ainsi qu’à sa diversité. Mais les fonctionnalités de recherche proposées sont tout aussi importantes, pour permettre à l’utilisateur de retrouver ses documents. Chacun de ces outils comprend les opérateurs AND, OR et NOT. Cependant, aucun ne permet l’utilisation d’opérateurs avancés comme intitle: (pour limiter la recherche au titre) ou filetype: (pour préciser le format des fichiers). L’interface de Yahoo! DS propose cependant d’affiner ses requêtes selon différents critères. En cliquant sur le bouton Refine situé à côté du champ de recherche, on fait apparaître au-dessus de la liste de résultats une nouvelle zone de saisie, permettant de limiter la requête selon chaque type d’indication fournie pour les documents trouvés (Source, Type, Name, Date…). On peut ainsi préciser une recherche et la réduire aux noms des fichiers, ou limiter une recherche en texte intégral à un certain format de fichier (.xls par exemple). Cette interface originale est particulièrement intéressante, car elle permet d’associer un grand nombre de critères de recherche. Plusieurs boutons proposent aussi de limiter d’emblée la recherche à une famille de fichiers (texte, images, musiques, messages, pièces jointes…). C’est aussi le cas de Copernic DS, qui offre une interface de recherche personnalisée pour chaque famille de fichiers (courriels, fichiers texte, musiques, images, vidéos, contacts, favoris, historique). Malheureu-sement, Copernic DS ne propose pas d’interface globale pour rechercher tous types de fichiers, et c’est là son principal défaut. Pour chaque famille de fichiers, Copernic DS met à la disposition de l’utilisateur, en plus du champ de recherche par mot-clé, plusieurs menus déroulants permettant d’affiner la requête. Pour la recherche de documents contenant du texte par exemple, il est possible d’indiquer : - le format de fichier désiré (txt, doc, pdf…) ; - la taille approximative (petit, moyen, grand) ou exacte (x Ko) du fichier recherché ; - sa date de création : là aussi, il est possible d’indiquer une date exacte ou une période estimée (aujourd’hui, hier, cette semaine..., ou entre un intervalle de dates) - sa situation supposée sur le disque (dossier Mes Documents, disque C: ou D:). Les fonctionnalités de recherche proposées par Google DS sont malheureusement moins fines. La recherche se fait globalement sur l’ensemble de l’index et ne peut pas être limitée à une famille de fichiers. Dans la liste de résultats, Google DS indique tout de même le nombre de fichiers textes, de messages et de pages Web de l’historique ayant été retrouvés. En cliquant sur chacune de ces indications, on peut accéder à une liste limitée à la famille de fichiers choisie. Mais ce processus détourné est le seul moyen de retrouver des documents d’un format donné... Autant dire qu’on en attendait davantage du leader des moteurs de recherche sur le Web ! MSN Search Toolbar propose, quant à lui, d’effectuer la recherche sur l’ensemble du disque (en sélectionnant le menu Desktop situé au dessus du champ de requête), ou de la limiter aux différentes familles de fichiers (menu File, puis bouton documents, music, pictures, videos), ou encore aux documents issus de Outlook et Outlook Express (menu Outlook et Outlook express). C’est déjà mieux que ce que nous offre Google DS, mais ce n’est pas encore la panacée. PRESENTATION DES RESULTATSLa présentation des résultats, ainsi que l’accès aux documents trouvés, diffèrent également d’un outil à l’autre. Avec Google DS, les résultats sont classés par ordre chronologique de création du fichier, mais peuvent aussi être classés par pertinence. Par défaut, Copernic DS regroupe les résultats selon leur dossier d’origine sur le disque, mais propose également de les classer par ordre chronologique ou par type de fichier. Yahoo! DS et MSN Search Toolbar disposent tous deux du même système de classement des résultats – système que l’on apprécie tout particulièrement car il offre plusieurs possibilités à l’utilisateur. La liste des résultats de Yahoo! DS comme de MSN Search Toolbar est organisée en colonnes, qui offrent chacune une information précise sur les résultats trouvés : nom, source, type de fichier, dossier d’origine, date…. Il suffit de cliquer sur le titre de la colonne de son choix pour classer les résultats selon un critère de date (classement chronologique), de nom de fichier (classement alphabétique), de type de fichiers, etc. C’est simple et très pratique. Enfin, l’accès au contenu du document permet également de départager ces quatre outils. Sur ce point, Yahoo! DS et Copernic DS prennent nettement l’avantage. En effet, leur interface logicielle offre la possibilité de prévisualiser le document sélectionné au sein de la liste de résultats, sans même avoir à ouvrir l’application liée. Pour Google DS comme pour MSN Search Toolbar, il faudra d’abord double-cliquer sur le résultat de son choix pour lancer l’application permettant de lire ce type de fichier, avant de pouvoir accéder au contenu du document. CONFIDENTIALITELà encore, ce sont les interfaces Web (Google DS et MSN Search Toolbar) qui apparaissent les moins fiables. Ces interfaces ont pour avantage d’effectuer simultanément une recherche sur le Web et sur son ordinateur. Dans ce cas cependant, le doute est permis sur la possibilité laissée à quelques personnes mal intentionnées d’accéder à nos données personnelles ; des failles de sécurité – aujourd’hui corrigées – furent ainsi découvertes sur la première version de Google DS. On remarquera toutefois que chacun de ces outils permet à l’utilisateur d’exclure de l’indexation certains dossiers ou types de fichiers, afin qu’ils ne puissent pas être recherchés. En définitive, les outils ayant adopté une interface logicielle apparaissent comme plus innovants et offrent globalement plus de fonctionnalités que les outils proposant une interface Web classique. Ces derniers proposent certes l’avantage de ne pas déstabiliser l’utilisateur habitué à ce type d’interface, mais elles sont plus limitées en termes de fonctionnalités de recherche, de modes de classement des résultats et d’accès aux documents. Quoiqu’il en soit, l’intérêt de tels outils est devenu incontestable, du fait de l’abondance de documents sauvegardés sur nos disques ; mais il ne faut pas pour autant s’abstenir de maintenir un peu d’ordre sur nos ordinateurs. En effet, les solutions “desktop search” semblent sans doute plus intéressantes à utiliser dans le cadre de recherches “transversales” (par exemple pour retrouver des documents qui auraient été réalisés autour d’un même concept) que pour localiser un document mal classé initialement. |
|