Netsources, Numéro de Juillet-Août 2007 - n°69


DocuFarm.com, pour repérer et prévisualiser les fichiers

Lorsque l’on souhaite identifier des documents à valeur ajoutée (rapports, thèses, articles, conférences...), il peut être utile, sur un moteur tel Google, de restreindre la sélection selon le type de fichier (PDF, Word, Excel, PowerPoint...).
Pour cela, on peut utiliser la grille de recherche avancée du moteur et choisir un format dans le menu déroulant, au regard de l’action “Limiter les résultats au format de fichier” ou encore saisir, dans la zone de saisie simple et en complément des mots-clés, l’opérateur filetype: suivi de l’extension du fichier (ex.: “web invisible” filetype:pdf...). ...

Auteur : Béatrice Foenix-Riou

Cette dernière procédure permet d’ailleurs de rechercher plusieurs formats simultanément – en ajoutant par exemple aux mots de la recherche : filetype:pdf OR filetype:doc OR filetype:xls... –, ce qu’il est impossible de faire depuis la grille de recherche avancée.

On peut alors, à partir de la liste des résultats, télécharger ceux que l’on souhaite visualiser et les ouvrir avec l’application appropriée (Adobe Acrobat, PowerPoint...), ou les consulter depuis le lien Version HTML, auquel cas on perd toutefois les illustrations, graphiques, images, etc.

Si l’on souhaite éviter cette procédure quelque peu complexe, il suffit désormais d’interroger DocuFarm.com.
Sa page d’accueil est constituée d’une zone de saisie pour inscrire les mots de la recherche, sous laquelle on coche le format de fichiers que l’on désire (tous ou pdf, ppt, doc, rtf, ps, xls).

DocuFarm interroge alors Google de façon transparente pour l’utilisateur et affiche une page de dix résultats ; contrairement à Google, on ne peut pas paramétrer ce nombre via un menu Préférences.

On regrettera que le nombre total de documents identifiés ne soit pas indiqué. On dispose simplement, dans le bas de l’écran, des liens Prev et Next pour accéder à d’autres pages de résultats.

Pour chaque document, DocuFarm donne son titre, un résumé pertinent, l’URL et le format.
Les différents opérateurs de Google (intitle:, site:...) peuvent être utilisés dans la stratégie.
Enfin, c’est la version Google.com qui est interrogée, ce qui explique la prédominance des documents en anglais dans les premiers résultats.

Mais l’atout majeur de DocuFarm réside dans le système de prévisualisation qu’il offre. En cliquant sur le titre d’un document en effet, l’outil affiche ses différentes pages sous forme de vignettes (avec illustrations...) tout en permettant, le cas échéant, de procéder à son téléchargement.

DocuFarm indique également la date de création du document original, sa taille et le nombre de pages.
Une zone de saisie affichée à cet endroit permet de lancer une recherche par mots sur le contenu du document prévisualisé.

Le service rendu est donc réel, tant pour la recherche (il est en effet fastidieux sur un moteur d’écrire filetype:ppt OR filetype:doc etc.) que pour l’évaluation des résultats.

Cerise sur le gâteau, DocuFarm propose l’installation d’une extension pour Firefox ou Internet Explorer qui permettra à l’internaute, lorsqu’il cliquera ultérieurement sur un document PDF, PPT, XLS... – et ce depuis n’importe quelle page sur le Web –, de le prévisualiser directement dans DocuFarm, sans avoir besoin de se connecter préalablement au service.

www.docufarm.com