
|
Netsources, Numéro de Septembre-Octobre 2006 - n°64 Savoir tirer parti des imagesDepuis de nombreuses années déjà, les moteurs de recherche ont compris tout l’intérêt que pouvaient représenter les images pour les utilisateurs, tout en étant conscient de la difficulté qu’il y avait à les identifier. Parallèlement à leur module de recherche sur le Web, plusieurs moteurs (notamment AltaVista, Yahoo!, Google, Ask.com...) ont donc offert un module spécifique, rassemblant les pages Web qui contiennent des images (fichiers jpg ou gif) et permettant d’identifier celles-ci via une recherche par mots sur les termes qui entourent le fichier dans la page. ... |
Auteur : Béatrice Foenix-Riou |
|
L’identification peut donc se faire de façon relativement précise,
bien plus précise en tout cas que si la recherche était lancée sur
le seul nom du fichier.
D’autant que certains moteurs offrent en complément diverses options pour préciser sa question. AltaVista permet ainsi de restreindre la sélection aux photos, aux graphiques et/ou aux boutons bannières, en couleur ou en noir et blanc, en précisant le cas échant une taille (petite, moyenne ou grande taille, 640x480, 800x600...). Google et Yahoo! pour leur part proposent tous deux une grille de recherche avancée sur les images, permettant classiquement de rechercher tous les mots, un des mots ou aucun des mots, en précisant le cas échéant la couleur des images, la taille, en limitant selon le nom de domaine du site et, pour Google, en restreignant à un format de fichier (JPG, GIF ou PNG). Ces index d’images ont aujourd’hui des volumes importants, puisque Google annonce indexer 2,1 milliards d’images (il en recensait 100 millions en 2001 !), quand Yahoo! communique sur 1,6 milliard de documents. La recherche d’images a d’ailleurs un large succès auprès du public puisque, d’après une étude datant de 2005 réalisée par la société Hitwise (http://actu.abondance.com/ 2005-45/trafic-google.php), Google Image Search est le deuxième service de Google le plus utilisé avec 9,2 % des visites, loin derrière bien sûr la recherche Web (79,9%), mais loin devant la recherche d’actualités (1,6 %) ou la recherche de livres (0,6 %) ! Pourtant, si l’utilisateur final a le réflexe “images” dès lors qu’il souhaite illustrer un dossier, le professionnel ne pense pas toujours à tirer parti de ces ressources, les jugeant à tort trop “grand public”. On trouvera donc ci-après, à titre d’illustration, quelques exemples de recherches “professionnelles” pour lesquelles le module Images peut s’avérer précieux. IDENTIFIER LES PRODUITS D’UNE ENTREPRISESe renseigner sur les produits d’une entreprise donnée compte parmi les questions récurrentes des professionnels de l’information, que ce soit dans le cadre d’une veille concurrentielle ou tout simplement pour mieux connaître les acteurs d’un marché. Plusieurs outils peuvent permettre d’arriver à ses fins, de la consultation du site de l’entreprise à la recherche dans les banques de données de presse, en passant par l’interrogation d’annuaires spécialisés tels le Kompass. La recherche peut néanmoins s’avérer longue et hasardeuse. Pour ce type de questions, interroger le module Images d’un moteur peut être une option intéressante. On pourra certes obtenir des images sans rapport avec la question, mais l’on peut aussi avoir de bonnes surprises et, en tout état de cause, on sait en quelques clics si la consultation des résultats mérite d’être poursuivie ou non. Ainsi, une requête sur Google Images avec le mot Guerlain permet d’identifier aisément de nombreux flacons du parfumeur et des produits de maquillage, quand Snecma affiche immédiatement des photographies du turboréacteur M53 (qui équipe les Mirage 2000) ou du turbofan M88-2 ... IDENTIFIER LES MARQUES DE DIFFERENTS PRODUITS GENERIQUESDe la même façon, l’identification de marques de produits génériques peut quelquefois se faire plus facilement via les images que via une recherche sur le Web. Si l’on souhaite par exemple obtenir les marques de différents fromages à pâte molle (de type camembert, brie, munster...), on pourra bien sûr lancer une requête sur Google Web avec les mots fromage OR fromages “pâte molle” OR “pâtes molles”. Mais cette question obtient 156 000 résultats, parmi lesquels il est difficile et fastidieux de faire le tri : les pages présentant un fromage particulier sont en effet noyées parmi celles expliquant la fabrication de ces fromages, leur répartition géographique, leur production et leur consommation, etc. La même question posée dans le module Images obtient 323 réponses et l’on peut repérer très vite les images de fromages ; en cliquant sur l’une d’elles, on affiche l’image dans son contexte et l’on constate que très souvent, cette image vient illustrer la présentation d’un ou de plusieurs fromages particuliers. Ces informations peuvent être issues notamment de blogs culinaires vantant les produits régionaux, du site d’un producteur ou d’un GIE de producteurs, de sites de fromagers, d’hypermarchés, etc. TROUVER UN SCHEMA, UN HISTOGRAMME... SUR UN SUJETQue ce soit dans le cadre d’une étude de marché ou pour illustrer un dossier, les informations – économiques ou autres – présentées sous forme graphique (histogrammes, courbes, camemberts, schémas...) sont généralement très appréciées des professionnels. Mais ce type d’information peut difficilement être recherché en tant que tel sur le Net et l’on compte le plus souvent sur le hasard pour en découvrir, au fil de la consultation des résultats. Or, des astuces existent pour identifier spécifiquement ce type de document – que ce soit des histogrammes sur la consommation d’énergie ou la structure cristallographique de la montmorillonite. Il faut tout d’abord, plus que jamais, prendre le temps de la réflexion et réfléchir aux caractéristiques de ce que l’on souhaite obtenir. Il faut tenter de “visualiser” le document en question (un graphique, un camembert, une structure cristallographique...), pour essayer de trouver ce qui le caractérise. Dans ce type de recherche, la “caractéristique” de ce que l’on souhaite n’est pas la présence d’un mot – le mot “camembert” ne figurera généralement pas dans la page qui contient un tel graphique –, mais réside dans le format du document. Dans une page Web en effet, les éventuels graphiques, courbes, histogrammes, schémas... ont en commun d’être le plus souvent au format JPEG ou GIF, c’est-à-dire d’être une image – dans les documents PDF en revanche, ce type d’information est intégré au texte et ne peut donc être différencié... Pour repérer les pages Web qui contiennent des images, on pourra donc tenter sa chance en saisissant simplement le thème de la question dans le module Images des moteurs. Si l’on souhaite par exemple connaître la structure cristallographique de la montmorillonite (une argile), on pourra lancer une requête dans Google Images, avec le simple mot “montmorillonite”. Les images représentant la structure de l’argile seront alors aisément identifiables, alors que sur le Web, il aurait fallu ouvrir chacun des résultats pour voir si l’image recherchée figurait dans la page... De la même façon, une requête dans le module Images avec les mots consommation énergie – en précisant le cas échéant site:gouv.fr pour limiter aux sources officielles – permettra de repérer facilement les pages contenant des diagrammes et autres courbes sur le sujet. La recherche semblera alors bien facile ... si l’on a pris le temps de la réflexion ! |
|