
|
Bases, Numéro de Avril-Mai 2007 - n°237 Stratégie présentée par Cedrom-SNIProblématique 3 : Obtenir des informations sur le “Web 2.0” afin de rédiger une synthèse qui sera diffusée en interne.
|
Auteur : |
|||
METHODE - ETAPE N°1 : UNE REQUETE TRES LARGE, POUR DEBROUSSAILLER LE TERRAINDémarche : nous travaillons sur tout le contenu offert par Europresse.com (publications et sites web référencés), avec une requête bilingue anglais / français. Requête : comme nous ne savons pas vraiment ce que nous cherchons dans un premier temps, nous partons d’une recherche très large dans le champ TITRE (TIT_HEAD=), sur 6 mois. TIT_HEAD= "web 2.0" Résultat : nous obtenons un nombre de réponses inexploitable, où les informations pertinentes sont complètement noyées dans la masse. Ces résultats nous permettent cependant d’établir une liste de mots-clés plus précis, à partir desquels nous affinons notre première requête. ETAPE N°2 : AFFINAGE DE LA REQUETEDémarche : nous devons préciser les mots-clés et utiliser de nouvelles clés de recherche pour éliminer le bruit. Requête : pour recentrer notre requête sur le sujet, nous y intégrons les mots-clés collectés lors de la première recherche. Nous introduisons aussi la clé LEAD – qui indique au moteur de ne chercher que dans l’introduction des articles –, et l’opérateur de proximité (%), qui précise le nombre de mots qui doivent séparer nos mots-clés. TIT_HEAD= "web 2.0" ET LEAD= (web ou internet) %5 (neuf ou neufs ou nouve* ou innov* ou new ou news) La troncature, c'est-à-dire *, permet de rechercher tous les termes issus d’un même mot. Par exemple innov* permet de rechercher les mots innovation, innovations, innover, innove… Résultat : Le nombre de résultats a diminué et l’on trouve des documents plus précis sur le sujet mais cependant, il y a toujours trop de bruit. ETAPE N°3 : AJOUT DE ETRMES SPECIFIQUESDémarche : À cette étape, nous avons identifié des noms d’acteurs et de projets qui nous semblent pertinents pour sélectionner les articles-clés. Requête : Nous précisons notre requête avec ces noms propres et noms de projets.
L’opérateur d’occurrence ( >n ) permet de sélectionner les articles qui comportent les termes cités entre parenthèses uniquement s’ils sont présents plus de n fois dans l’article. Résultat : les articles obtenus sont les plus pertinents sur le sujet et nous permettent de nous faire une bonne idée de ce qu’est le Web 2.0. CONCLUSION
|
||||