Actualités
Agenda
Liens utiles
Netsource
Netsource - Sommaire en cours
Netsource - Anciens sommaires
Netsource - Recherche des archives
Revue Bases
Revue Bases - Sommaire en cours
Revue Bases - Anciens sommaires
Revue Bases - Recherche des archives
Ouvrages
Qui sommes-nous ?
Notre équipe
Accueil > Netsources > Anciens sommaires > Méthodologies de recherche

Netsources, Numéro de Juillet-Août 2001 - n°33


Méthodologies de recherche

"Elémentaire mon cher Watson"

Auteur : Béatrice Foenix-Riou

 
Pour certaines requêtes complexes, l’interrogation des moteurs de recherche classiques (Google, AltaVista...) ne donne pas de résultats satisfaisants ; la bonne tactique est alors de repenser le problème et d’identifier d’autres types d’outils susceptibles d’apporter des réponses : listes de liens, portails thématiques, etc.
   
Malheureusement, nombre de netsurfers abandonnent la recherche à cette étape – ou s’installent pour de longues heures d’investigation avec leurs outils habituels –, faute de connaître d’autres “bases de départ” que les classiques moteurs et annuaires généralistes.
   
Pour les aider, il nous a semblé intéressant de lancer une rubrique spécifiquement dédiée aux “Méthodologies de recherche”, jusqu’ici traitées au fil d’articles généraux.
   
A partir d’une question concrète, nous y détaillerons les différentes étapes de la recherche, expliquant aussi bien la méthodologie employée, le choix des outils, la formulation de la requête que les résultats obtenus.
   
Bien évidemment, sur Internet plus qu’ailleurs, un problème peut être résolu en utilisant différentes méthodologies et familles d’outils. Les solutions que nous présenterons ne seront donc pas les seules, et n’auront pas pour objectif de traiter totalement la question ; leur vocation est de présenter aux lecteurs des familles d’outils comme des stratégies astucieuses, dont ils pourront s’inspirer pour leurs propres recherches.
   
Nous incitons d’ailleurs les lecteurs à nous transmettre les problèmes qu’ils n’ont pu résoudre ; nous choisirons nos exemples dans les requêtes soumises et tenterons de les traiter ici. Enfin, cette rubrique peut s’enrichir grâce à vous : lorsque des “chemins détournés” vous ont permis de répondre à une question, lorsque vous utilisez des “trucs et astuces” dans l’élaboration de votre stratégie, ou lorsque vous avez    ÿidentifié d’autres approches pour résoudre un des problèmes de la rubrique de façon satisfaisante... faites-en profiter les lecteurs de Netsources : envoyez-nous le détail de votre stratégie, nous la publierons dans ces colonnes.
   

LA MEUNERIE AUX ETATS-UNIS : NOMBRE DE MOULINS, CAPACITES, LOCALISATION, TYPES DE FARINE PRODUITES …

   
Nous avons choisi pour inaugurer cette rubrique la question : “La meunerie aux Etats-Unis : nombre de moulins, capacités, localisation, types de farine produites” ; les mots-clés en anglais sont milling ou flour milling pour l’industrie de la meunerie et flour mill pour la meunerie en général et pour le lieu où s'effectue la transformation des grains de céréales en farine (moulin...).
   
Lorsqu’il s’agit de trouver la réponse à une question, quelle qu’elle soit, la tendance première d’une majorité de netsurfers est d’interroger immédiatement leur outil de recherche “préféré”, pour voir “ce que cela donne”... Cette tactique permet effectivement d   Èe définir quel type d’outil il faut – ou il ne faut pas – interroger ; toutefois, il serait plus adapté de prendre quelques minutes pour préparer sa stratégie, en répondant préalablement à trois questions :
- quels sont les types d’information que je recherche ?
- quels sont les types de sources susceptibles de les proposer ?
- sur quels types de sites ai-je des probabilités de trouver ces informations ?
   
Les réponses à ces questions permettront en effet d’avoir une idée plus précise du type de site ou de page Web que l’on recherche, et par conséquent de la famille d’outils la mieux à même de les identifier.
   
Dans notre exemple, les réponses sont :
- je recherche principalement des données chiffrées, les plus récentes possible, sur une industrie (la meunerie) dans un pays (les Etats-Unis) ;
- ce type de données peut se trouver notamment dans des articles ou des études de marché, ou encore être fourni par des associations ou des sources officielles ;
- les publications spécialisé   Äes, les associations comme les sources officielles peuvent avoir leur propre site ; les études de marché sont souvent regroupées sur les sites d’agrégateurs ; il peut d’autre part exister des portails sur la meunerie, reprenant certaines des données ; enfin, il peut exister des listes de liens utiles sur le sujet.
   
Ces réponses permettent de choisir le type d’outil avec lequel on peut commencer ses tests : il est vraisemblable qu’il existe sur le Web des sites spécialisés sur le sujet de la meunerie ; par conséquent, il est préférable d’effectuer les premiers tests avec un annuaire (Yahoo!...), plutôt qu’avec un moteur  (Google...).
   

PREMIERE ETAPE : DES ANNUAIRES POUR IDENTIFIER D’EVENTUELS SITES SPECIALISES

   
Dans notre exemple, nous cherchons à identifier des sites spécialisés sur la meunerie et des informations concernant les Etats-Unis. Deux sources s’imposent donc : Yahoo.com –    dl’outil de recherche le plus connu du Web –, et son concurrent direct l’Open Directory (dmoz.org), qui recense le plus grand nombre de sites (2,8 millions de sites classés dans plus de 397 000 catégories, contre deux millions environ pour Yahoo!).
   
La stratégie la plus simple est, dans un premier temps, de formuler sa question de façon assez large, pour sélectionner à la fois les sites qui contiennent les mots “flour milling” et “flour mill(s)” dans leur résumé.
   
Les deux annuaires acceptant la troncature, la requête pourra donc être “flour mill*”.
Hélas, les résultats sont décevants : Yahoo! n’identifie que 6 sites et 0 catégorie lorsque les mots sont saisis entre guillemets et 43 sites et 0 catégorie dans le cas contraire.
   
Ces 43 sites sont presque tous des sites commerciaux présentant les activités de leur éditeur : meunerie, préparation d’aliments, re   ìstauration... Une description toutefois, bien que concernant un site australien, retient l’attention ; elle émane en effet d’un site associatif et est donc susceptible d’offrir une liste de liens sur le sujet.
Australia > Business and Economy > Business to Business > Agriculture > Organizations
* Australian Technical Millers Association - dedicated to the flour stockfeed and other supportive industries.
   
Une visite sur le site de l’ATMA (Australian Technical Millers Association) révèle effectivement la présence d’une rubrique Industry Links particulièrement riche.
   
On y trouve plusieurs centaines de liens vers des sites classés dans différentes catégories : Educational + Research & Development ; Flour Milling ; Mill Engineering & Equipment Suppliers ; Miscellaneous ; Heritage Mills  ; Rice Milling ; Services  ; Stockfeed Milling : North American Milling Links ; United Kingdom Milling Links.
   
Même si quelques tests semblent montrer un pourcentage non négligeable de liens morts (page not found), la page mérite que l’on s’y attarde.
   
Dans la rubrique Miscellaneous, le lien Flour mill stats attire ainsi l’attention. Il conduit en fait au site du US Census Bureau, et donne accès à de nombreuses statistiques concernant la production de farine et la capacité des moulins aux Etats-Unis. Les données proviennent d’enquêtes mensuelles effectuées auprès de tous les acteurs de l’industrie de la meunerie, pour le blé et le seigle.
   
Plusieurs dossiers au format PDF offrent des statistiques, par mois, trimestres ou années (de 1997 au deuxième trimestre 2001 !) concernant la production de blé et de seigle, de farine pour l’alimentation, la répartition selon les états des Etats-Unis, etc. Toutefois, si le site de l’US Census Bureau répond à une partie de la question, il ne donne aucune information sur le nombre de moulins, leur localisation...
   
La poursuite des tests sur l’Open Directory ne s’avère guère plus fructueuse : 30 catégories et 46 sites sont identifiés lorsque la requête est saisie entre guillemets ; 45 catégories et 67 sites dans le cas contraire. On notera cependant que contrairement à Yahoo, les catégories sélectionnées par Dmoz ne sont pas celles qui contiennent les termes de la requête dans leur libellé, mais celles qui recensent un site ayant les termes de la requête dans le libellé !
   
Là encore, les résultats sont en quasi-totalité des sites commerciaux. Deux sites associatifs offrent bien quelques informations concernant le domaine, mais ne permettent pas de répondre à la question.
   
Cette première étape a nécessité près d’un quart d’heure pour lire les quelques pages de résultats des deux annuaires et pour tester les rares sites qui semblaient intéressants. Elle permet de déduire que sur le sujet de la meunerie, les deux principaux annuaires recensent presque exclusivement des sites commerciaux ; aucune publication n’apparaît clairement et les sites associatifs sont extrêmement rares.
   
On peut penser que s’il existait un portail thématique sur le sujet, on l’aurait identifié dans l’une des deux sources, les éditeurs de portails optimisant généralement leur référencement pour être aussi visibles que possible.
   
En revanche, il peut tout à fait exister d’autres sites associatifs et des pages personnelles, qui peuvent s’avérer très utiles et qui sont généralement moins bien recensés par les annuaires.
Plutôt que de poursuivre la recherche avec Dmoz et Yahoo, il semble donc préférable d’utiliser d’autres pistes.
   

DEUXIEME ETAPE : DES MOTEURS POUR IDENTIFIER DES SIGNETS SPECIALISES

   
Les pages de liens comptent parmi les premiers outils de recherche thématiques du Net. Réalisées généralement par des organismes à but non lucratif, des experts ou des passionnés d’un domaine, elles ont souvent été créées dans l’optique qui a prévalu à la naissance de l’Internet : partager ses connaissances avec la communauté des netsurfers.
   
Ces ressources se composent souvent de quelques pages Web offrant un très grand nombre de liens, sur des sujets qui peuvent être généraux ou au contraire extrêmement précis. Malgré leur richesse, elles sont rarement visibles dans les annuaires généralistes. Ce sont en effet souvent des pages personnelles – mal référencées – ou des rubriques à l’intérieur d’un site, difficilement décelables sur un annuaire.
   
Il existe pour les identifier certaines astuces, qui ne permettent en aucun cas un recensement exhaustif, mais qui peuvent apporter une aide précieuse pour localiser quelques bases de départ, afin de poursuivre la recherche depuis une sélection validée.
   
L’une de ces astuces consiste à tirer parti du fait que de nombreuses listes de liens disponibles sur le Net contiennent l’un des mots suivants dans leur URL : signet(s), bookmark(s), lien(s), link(s) ou rencore resource(s).
   
On peut alors tenter de les identifier en utilisant l’un des moteurs de recherche qui possèdent comme critère de sélection la limitation de la requête à l’URL des pages.
   
Parmi les moteurs qui offrent cette fonctionnalité, on citera Google, Northern Light, All The Web et AltaVista.
   
Avec Google, la recherche doit se faire dès l’écran d’accueil, en ajoutant aux termes de la requête l’opérateur inurl: directement suivi du mot link (ou links, bookmark...). Comme Google ne comprend pas la troncature, la recherche doit être réexécutée en combinant à la fois les différentes formes du sujet (flour mill, flour mills, flour milling, etc.) et les variantes possibles de l’URL (link, links, bookmark...).
   
La grille de recherche avancée ne doit pas être utilisée car elle ne permet pas de combiner la recherche de deux termes, sur la page et dans l’URL (voir Netsources n° 32).
Northern Light pour sa part est bien plus sophistiqué. Il comprend la troncature et les opérateurs booléens (AND, OR, NOT).
   
On peut donc, sur la grille de recherche avancée, inscrire dans les différentes zones de saisie appropriées que la requête doit contenir certains mots dans la page (flour mill*) et dans l’URL (link OR links OR bookmark OR bookmarks OR resources).
   
Sur la grille de recherche avancée de All The Web, plusieurs zones de saisie permettent de spécifier qu’il faut rechercher des mots présents impérativement (Must include) dans le texte de la page ou dans l’URL.
   
All The Web ne comprenant ni la troncature ni les opérateurs booléens, il faudra, pour être aussi exhaustif que possible, combiner les différentes variantes.
   
Avec AltaVista enfin on peut, dès l’écran d’accueil, formuler sa requête en utilisant à la fois la troncature et l’opérateur url: (Ex.: +“flour mill*” +url:link)
   
La grille de recherche avancée permet ici de combiner les différentes variantes de l’URL grâce aux opérateurs booléens (Ex.: "flour mill*" AND url:(link OR links OR bookmark OR bookmarks OR resources)).
   
Il faut bien sûr penser à lancer la recherche sur le Web mondial, et non sur le Web français, qui est l’option par défaut.
   
Dans notre exemple, le nombre de pages identifiées varie fortement selon la stratégie utilisée et les moteurs interrogés ; les résultats s’échelonnent entre une page pour flour mill et bookmark et 151 pages pour "flour mill*" and url:(link or links or bookmark or bookmarks or resources)).
   
Une lecture rapide des résultats permet d’identifier aisément quelques pages qui semblent concerner spécifiquement la meunerie (de nombreuses pages sont en effet visiblement hors sujet).
   
Parmi celles-ci, on trouve par exemple :

- Dover Flour Mills
An Incomplete Listing of Flour Milling Resources on the Net. Many new additions, last modified 16/05/98. (If you have a link, and it is not here,...)
http://www.iol.ie/~gavo/link.html

- Links to Other Related Mill Sites and Mill Sites The Page Begins Here.
Links to Other Mill Related Sites and Mill Sites. -This page is constantly being updated, so please keep checking back- Other...
http://www.angelfire.com/journal/millrestoration/links.html

- The Flour Advisory Bureau - Resources
... Carrs Flour Mill Ltd, www.milling.co.uk. The ... co.uk. Smiths Flour Mills, www.smiths-flour-mills.co.uk. ... Meat, www.britishmeat.org.uk. Farm Links, www.sfacet.org.uk. ...
www.fabflour.co.uk/links.asp - 18k

- Links (c’est en fait la page de liens du site de l’ATMA identifié avec Yahoo)
... Research & Development. Flour Milling. Mill Engineering & Equipment Suppliers. ... North American Milling Links. United Kingdom Milling Links. ...
www.atma.asn.au/links.htm - 101k

- Kansas Wheat Commission Links
Kansas Wheat Commission Links. Wheat Promotion. Other Wheat Commissions. Wheat Research. Grain Industry. Grain Companies & Export Ports. Farm &...
http://www.kswheat.com/Links.htm
   

TROISIEME ETAPE : EXPLORATION DES PAGES DE LIENS

   
Il reste alors à se connecter à ces pages et à lancer des investigations plus fouillées depuis les liens proposés.
   
La première page identifiée – “An Incomplete Listing of Flour Milling Resources on the Net” – semble être la page personnelle d’un passionné du domaine, et propose un recensement de plusieurs centaines de liens. Mais elle annonce clairement que la dernière mise à jour a eu lieu en ... mai 98 ; les liens ne sont d’ailleurs plus cliquables. Fort heureusement, les URLs sont inscrites clairement face au nom de chaque site.
   
L’intérêt de cette page, malgré son manque de fraîcheur, est que trois rubriques apparaissent comme étant susceptibles de nous aider dans notre quête : Publishers, Resource Pages et Miscellaneous.
   
Dans cette dernière, on retrouve notamment la page Flour mill stats du US Census Bureau. Poursuivant l’enquête, nous avons exploré les rares liens de la rubrique Publishers.
   
Le premier est celui de GrainNet, News & Informat   Ãion for the Grain, Milling, Feed & Seed Industries (www.grainnet.com).
   
En complément de nombreux articles et dépêches sur l’actualité du grain et de la meunerie, il offre dans sa rubrique Directories/Links un recensement des sites du domaine classés dans plusieurs catégories : sites Web, annuaires, fabricants et fournisseurs, associations...
   
Le deuxième éditeur identifié est Sosland Publishing Company (www.sosland.com), qui se définit sur sa page d’accueil comme “the leading information provider for the grain-based foods and meat and poultry industries, with a portfolio that includes online communities, print magazines, newsletters, directories, reference books and industry conferences”.
   
Voila qui semble de bon augure !
   
En fait, le site semble donner accès aux archives de plusieurs publications de Sosland, dont Milling & Baking News, Baking & Snack, Baking Buyer, Bakery Production and Marketing Newsletter (regroupées sur le site www.bakingbusiness.com),    flWorld Grain (www.world-grain.com) et Meat & Poultry (www.meatpoultry.com).
   
Dès les premiers tests sur World Grain – The Grain and Grain Processing Information Site –, on se dit que l’on touche peut-être au but. Le site est construit autour de la publication World Grain Magazine, et permet des recherches par mots sur les archives (en accès libre), avec deux ans d’antériorité.
   
Les possibilités de recherche sont réduites, mais devraient permettre d’identifier quelques articles de fond sur le sujet.
   
Et le site ne s’arrête pas là !
   
Des liens sur la gauche proposent ainsi des choix comme Industry Data, Product News, World Grain Wire, Resource Center ...
   
La rubrique Industry Data donne envie de s’écrier “bonne pioche” ! On y trouve en effet de nombreuses statistiques concernant la meunerie aux Etats-Unis, couvrant aussi bien les moulins que les grains.
   
Ainsi, la rubrique Milling Companies/Mills offre un véritable recensement des moulins aux Etats-Unis, classés par catégories,    ›selon le type de farine : Milling Companies/ Mills ; Multiple Mill Companies ; Multiple Mix Companies ; Wheat, Family Flour Mills ; Durum Mills ; Bulgur Mills  ; Rye Mills  ; Soy Flour Mills ; Dry Corn Mills, Corn Refiners ; Buckwheat Mills ; etc.
   
Chaque catégorie donne la liste des moulins, classés par ordre alphabétique ou par Etat ; pour chaque moulin, une fiche descriptive indique ses coordonnées (adresse, e-mail, site Web..), le nom des responsables, la capacité de production et de stockage..
   
Dans la rubrique Milling Statistics, des tableaux récapitulatifs indiquent, pour les entreprises les plus importantes, leur capacité par type de farine (blé, blé dur, seigle),  le nombre de moulins...
   
Bref, même si l’on peut regretter que dans les tableaux, certains chiffres datent de 1998 ou 1999, le site World Grain (www.world-grain.com) s’avère extrêmement riche pour répondre à la question (même si d’autres méthodologies et d’autres sites auraient sans doute permis de le faire).
   
Le traitement de cette question amène plusieurs réflexions.
   
La première est qu’il est primordial, avant de se lancer dans la recherche, de définir aussi précisément que possible le type de sites susceptible de contenir les informations souhaitées.
   
C’est parce que l’on recherchait précisément des sites d’éditeurs que Sosland Publishing Company, éditeur de World-Grain Magazine, a été identifié dans la liste de liens.
   
La seconde est qu’il est souvent inutile de persévérer longtemps avec le même outil de recherche. Si les premiers tests s’avèrent infructeux, il faut utiliser une autre famille d’outils.
   
Dans notre exemple, de longues investigations sur Yahoo ou Dmoz auraient vraisemblement permis d’identifier quelques sites associatifs complémentaires, qui auraient peut-être donné d’autres listes de liens, menant sans doute vers Sosland.
   
Mais il était infiniment plus rapide ici d’identifier directement des pages de liens en utilisant les possibilités de recherche avancées des moteurs.
   
Le site de Sosland lui-même avait pour sa part peu de chance d’être identifié directement dans un annuaire : il n’est pas recensé par Dmoz et est indexé par Yahoo! dans la catégorie Business and Economy > Business to Business > Food and Beverage > Trade Magazines
* Sosland Publishing Company - publisher of information products and services for the grain-based foods industry.
   
Quant au site de World-Grain, il semble bien n’être identifiable que via les pages de liens :  il n’est indexé ni dans Dmoz ni dans Yahoo, et des moteurs comme Google, All The Web, Northern Light ou AltaVista ne contiennent aucune page du site dans leur index ! En revanche, All The Web identifie 38 pages pointant vers le site de World-Grain, AltaVista en recense 19, et Google aucune. Une bonne illustration des méthodes de recherche sur le Web invisible...

 

Version imprimable
BASES PUBLICATIONS
27, rue de la Vistule
75013 Paris
Tél. : 01.45.82.75.75
contact@bases-publications.com
Abonnez-vous   |   Contact   |   Mentions légales |   Crédits