Actualités
Agenda
Liens utiles
Netsource
Netsource - Sommaire en cours
Netsource - Anciens sommaires
Netsource - Recherche des archives
Revue Bases
Revue Bases - Sommaire en cours
Revue Bases - Anciens sommaires
Revue Bases - Recherche des archives
Ouvrages
Qui sommes-nous ?
Notre équipe
Accueil > Bases > Anciens sommaires > Stratégie présentée par Cedrom-SNI

Bases, Numéro de Avril-Mai 2007 - n°237


Stratégie présentée par Cedrom-SNI

Problématique 3 : Obtenir des informations sur le “Web 2.0” afin de rédiger une synthèse qui sera diffusée en interne.
Difficulté : Retrouver les informations les plus pertinentes parmi la masse d’information accessible sur Europresse.com

Auteur :

 

METHODE - ETAPE N°1 : UNE REQUETE TRES LARGE, POUR DEBROUSSAILLER LE TERRAIN


Démarche : nous travaillons sur tout le contenu offert par Europresse.com (publications et sites web référencés), avec une requête bilingue anglais / français.
   
Requête : comme nous ne savons pas vraiment ce que nous cherchons dans un premier temps, nous partons d’une recherche très large dans le champ TITRE (TIT_HEAD=), sur 6 mois.

            TIT_HEAD= "web 2.0"


Résultat
: nous obtenons un nombre de réponses inexploitable, où les informations pertinentes sont complètement noyées dans la masse. Ces résultats nous permettent cependant d’établir une liste de mots-clés plus précis, à partir desquels nous affinons notre première requête.  

ETAPE N°2 : AFFINAGE DE LA REQUETE


Démarche : nous devons préciser les mots-clés et utiliser de nouvelles clés de recherche pour éliminer le bruit.
   
Requête : pour recentrer notre requête sur le sujet, nous y intégrons les mots-clés collectés lors de la première recherche. Nous introduisons aussi la clé LEAD – qui indique au moteur de ne chercher que dans l’introduction des articles –, et         l’opérateur de proximité (%), qui précise le nombre de mots qui doivent séparer nos mots-clés.
       
        TIT_HEAD= "web 2.0" ET LEAD= (web ou internet) %5 (neuf ou neufs ou nouve* ou innov* ou new ou news)
       
La troncature, c'est-à-dire *, permet de rechercher tous les termes issus d’un même mot. Par exemple innov* permet de rechercher les mots innovation, innovations, innover, innove…
   
Résultat : Le nombre de résultats a diminué et l’on trouve des documents plus précis sur le sujet mais cependant, il y a toujours trop de bruit.
 

ETAPE N°3 : AJOUT DE ETRMES SPECIFIQUES

   
Démarche : À cette étape, nous avons identifié des noms d’acteurs et de projets qui nous semblent pertinents pour sélectionner les articles-clés.

Requête : Nous précisons notre requête avec ces noms propres et noms de projets.

Requête sur Europresse
TIT_HEAD= "web 2.0" ET LEAD= (web ou intranet) %5 (neuf ou neufs ou nouve* ou innov* ou new ou news) ou TEXT= "web 2.0" ET ("tim o reilly" ou "second life" ou youtube ou dailymotion ou "roy fielding" ou "dale dougherty")     >2 ou TEXT= "web 2.0" ET ("web participatif" ou "architecture de participation" ou "really simple syndication" ou folksonomie ou "repertoires de blogs" ou "social bookmarking" ou "web semantique" ou "read write web") >2 SANS TEXT= "neuf cegetel"

    
L’opérateur d’occurrence ( >n ) permet de sélectionner les articles qui comportent les termes cités entre parenthèses uniquement s’ils sont présents plus de n fois dans l’article. 
   
Résultat : les articles obtenus sont les plus pertinents sur le sujet et nous permettent de nous faire une bonne idée de ce qu’est le Web 2.0.

CONCLUSION


Cette requête a été construite de façon très progressive, car nous n’avions aucune connaissance préalable du sujet. Chaque résultat obtenu permet d’affiner la requête précédente. Les termes rajoutés permettent d’éliminer par exemple les simples citations et de se recentrer sur les articles explicatifs. La Clé occurrence (>) joue elle aussi un rôle important et permet d’éliminer facilement le bruit. 



 

Bases 237_Cedrom-SNI.3

Version imprimable
BASES PUBLICATIONS
27, rue de la Vistule
75013 Paris
Tél. : 01.45.82.75.75
contact@bases-publications.com
Abonnez-vous   |   Contact   |   Mentions légales |   Crédits