
|
Netsources, Numéro de Mai-Juin 2005 - n°56 Trop de réponses sur un moteur : changez d'outil de rechercheLes derniers chiffres concernant les parts de marché des outils de recherche francophones* sont révélateurs d’une situation que chacun pressent : le réflexe quasi-unanime des internautes à la recherche d’information est aujourd’hui d’interroger le moteur Google. Ce dernier, qui est l’un des rares moteurs dont la consultation en mai a progressé par rapport à celle du mois d’avril, caracole largement en tête et représente ... 79,5 % du trafic généré par les outils de recherche francophones ! ... |
Auteur : Béatrice Foenix-Riou |
|
Il est suivi très loin derrière par Yahoo! (5,70 %), Voila (4,61%)
et MSN (3,77 %), ce qui laisse moins de 6,5 % à l’ensemble des
autres outils !
Certes, ces chiffres concernent le marché francophone et non le marché mondial – d’après OneStat par exemple, Google ne génèrait en avril “que” 56,4% du trafic aux Etats-Unis, suivi par Yahoo! avec 21,1% – et les statistiques peuvent varier légèrement d’une source à l’autre (Ad’oc, Weborama...). Mais toutes s’accordent pour reconnaître que Google devient aujourd’hui synonyme de “recherche sur le Web”... Et pourtant, il est des questions pour lesquelles le moteur chéri des internautes se révélera bien moins pertinent que d’autres outils. Nous l’illustrerons avec la recherche suivante : comment identifier des sites de référence – autrement dit des sites à valeur ajoutée, offrant un réel contenu, par opposition aux sites commerciaux – concernant la gestion des ressources humaines, au niveau international. La gestion des ressources humaines (human resources management) est un sujet large et même extrêmement large. Elle recouvre en effet des domaines comme le recrutement, la gestion des carrières, la formation, mais aussi l’évaluation des performances, les conditions de travail, la motivation du personnel, en passant par la gestion des conflits et la concertation sociale. Avec une couverture aussi vaste, il n’est pas étonnant que les sites sur le sujet pullulent. Ainsi, une requête sur Google avec les mots gestion “ressources humaines” affiche plus de 1,7 million de pages (et 663 000 pages si l’on restreint à l’expression “gestion des ressources humaines”), quand “human resources” management obtient rien moins que 35 millions de pages (réduit à 3,2 millions de pages si l’on limite la requête à l’expression “human resource management”). Difficile ici de faire son tri dans les résultats, même en utilisant des opérateurs comme intitle:, pour limiter la requête au titre des pages ! Certes, l’on pourrait se contenter de “picorer” parmi les premières pages de résultats, qui mettent en avant des sites d’associations du domaine (Society for Human Resource Management, International Association for Human Resource Information...), des portails spécialisés et des sociétés de conseils en gestion des RH... Mais cette solution laisse un sentiment d’insatisfaction, tant l’on garde une impression de “hasard” dans le classement des premiers documents, tout à fait pertinents au demeurant. L’algorithme de Google – basé en partie sur le PageRank, c’est-à-dire sur le nombre de liens pointant vers les pages, et sur la notoriété des pages qui offrent le lien –, n’a plus à faire ses preuves et est l’une des composantes du succès du moteur. Mais aussi performant soit-il, on ne peut raisonnablement se contenter d’une sélection de vingt pages – la majorité des internautes ne dépassent pas la deuxième page de résultats –, quand celle-ci est choisie de façon automatique dans un échantillon de plusieurs millions. Sur ce point, l’outil Ranking.thumbshots.com (voir Netsources n°49) illustre parfaitement le côté “aléatoire” d’une telle sélection. En analysant les cent premiers résultats d’une même requête posée à deux moteurs (Google et Yahoo! par exemple), Ranking Thumbshots illustre que le taux de recouvrement des résultats est le plus souvent inférieur à 30 % (seulement !), et qu’une part importante des pages identifiées par les deux moteurs sont classées dans un ordre totalement différent. Notre recherche ne fait pas exception : les cent premières pages sélectionnées par Google et Yahoo! pour la requête “human resource management” comprennent 77 % de pages “uniques” (identifiées par un seul des moteurs), pour 23 % de résultats communs ; ces derniers sont représentés dans l’écran ci-dessous par de petits cercles pleins, chaque cercle étant une page, les même pages étant reliées par un trait, permettant de comparer leurs classements respectifs. Pour répondre à une requête de ce type – identifier les ressources les plus riches parmi des millions de pages –, il est donc indispensable d’utiliser une sélection “manuelle”, effectuée par un expert ou un professionnel du domaine et non l’algorithme de classement d’un moteur. Le nombre de résultats obtenus ici prouvant qu’il existe de multiples sites spécialisés sur le sujet, le réflexe à avoir est de tenter d’identifier ces sites, plutôt que de s’obstiner à faire un tri parmi les millions de pages sélectionnées par le moteur. C’est donc un annuaire qu’il faut interroger. ANNUAIRES GENERALISTES : LES SITES COMMERCIAUX EN VALEUREu égard à leur couverture, les annuaires généralistes sont à même de recenser de nombreux sites spécialisés sur un sujet comme la gestion des ressources humaines. La recherche peut s’y faire par mots – elle porte alors sur les catégories et les descriptions des sites – ou par navigation dans l’arborescence thématique. Une recherche par mots sur les deux annuaires les plus importants – Yahoo.com et Dmoz.org – obient ainsi, à la question "human resource" OR "human resources" management, 1 294 sites pour Yahoo.com (onglet Directory) et 1 600 sites sur Dmoz. Dans chaque cas, de nombreuses rubriques sont identifiées. La navigation à partir de ces rubriques permet ensuite d’élargir la sélection, car on y trouvera des sites forcément pertinents – indexés par des professionnels –, qui ne contiennent pas les mots de la requête dans leur description (très courte). On trouve ainsi : • sur Yahoo.com : Directory > Business and Economy > Business to Business > Corporate Services > Human Resources, qui regroupe 4 569 sites, dans des sous-rubriques aussi variées que Consulting (737 sites), Employee Benefits (207), Outsourcing (70), Recruiting and Placement (2 669)... • sur Dmoz : l’arborescence adoptée est différente et l’on trouve aussi bien des rubriques comme Business > Human Resources – qui répertorie plus de 1 000 sites dans des catégories telles que Employee Relations (99 sites), Recruiting and Retention (76), Training and Safety (107)...–, que Business > Employment (1 513 sites), qui regroupe des catégories comme Recruitment and Staffing (718 sites), Careers (196) ... Cela étant, l’utilisation d’un annuaire généraliste pour une telle question ne résout pas toutes les difficultés. Il reste en effet à faire le tri parmi les sites sélectionnés, qui sont en majorité des sites d’entreprises – surtout sur Yahoo.com, où le soumissionnement est payant ! On peut bien sûr explorer les rubriques, pour tenter d’y découvrir des sous-rubriques comme ...> Human Resources > Directories (6 sites) sur Yahoo! ou ...> Human Resources > Reference (52 sites) sur Dmoz. Mais lorsque l’on est confronté à un nombre de résultats trop important sur un annuaire généraliste, une alternative consiste, encore une fois, à changer de famille d’outils. PAGES DE LIENS : DE BONS POINTS DE DEPARTPour une requête aussi large, les pages de liens peuvent constituer de bons points de départ. Réalisées souvent par des experts ou des passionnés, elles rassemblent une sélection choisie de ressources, qui sont quelquefois classées par catégories. Nous avons donné plusieurs fois dans nos colonnes des astuces pour identifier ces signets avec un moteur de recherche (lire notamment l’article “ Trucs et astuces pour un chasseur de liens”, Netsources n°51). Mais le sujet étant ici relativement vaste, on interrogera de préférence Teoma.com, qui a pour caractéristique de localiser spécifiquement des pages de liens offrant un riche contenu – elles apparaissent sous la rubrique “Resources - link collections from experts and enthusiasts. Si nous avons utilisé dans les annuaires généralistes la stratégie "human resource" OR "human resources" management, l’identification de pages de liens peut se faire de façon plus précise et l’on peut tenter sa chance avec l’expression “human resource management”** Teoma affiche pour cette requête un certain nombre de signets, issus notamment de sites universitaires, de portails spécialisés, de bibliothèques.... Les premiers donnent entière satisfaction et présentent une sélection de sites dans le domaine de la gestion des ressources humaines – avec une brève description pour chacun –, classés dans des catégories comme General HR Links, Human Resource Publications, HRM Courses on the Internet, Business Psychology... Néanmoins, si les pages de liens répondent parfaitement à la question, on peut souhaiter obtenir une sélection plus qualitative de sites. On se tournera alors vers les répertoires sélectifs, ces annuaires réalisés par des bibliothèques ou des universités et qui ont pour vocation de sélectionner le “meilleur du Web”, afin de répondre aux questions d’enseignants, chercheurs et étudiants (voir Netsources n°42). REPERTOIRES SELECTIFS :POUR LOCALISER LE “MEILLEUR” DU WEBParmi les divers outils de recherche existant sur le Web, les répertoires sélectifs se caractérisent par leur stabilité. Cette offre ancienne, peu utilisée – car très mal connue des internautes –, peut apporter une aide précieuse pour de nombreuses requêtes. Ainsi, Sosig – Social Science Information Gateway, www.sosig.ac.uk – se définit comme “Your Guide to the Best of the Web for Social Science”. A la requête human resource management, il identifie 154 sites et la catégorie “human resources management”. Celle-ci liste une centaine de sites classés dans des rubriques comme Editor's Choice (key resources in this subject), Journals (contents and abstracts), Journals (full text) News, Resource Guides... et donne pour chacun une description très détaillée du contenu, des mots-clés, etc. Bien sûr, tous les répertoires sélectifs ne répondront pas de façon aussi pertinente à une telle question. Car si Sosig est centré sur les sciences sociales, d’autres concernent plutôt l’ingénierie, les sciences de la vie, les sciences humaines, etc. Comment identifier ces répertoires sélectifs ? Rien de plus simple. Depuis le site Les Signets de la Bnf (http://signets.bnf.fr, voir Netsources n°50), il suffit de cliquer sur la rubrique Outils Internet, puis sur la catégorie Répertoires sélectifs. Et l’on dispose alors de la description détaillée d’une vingtaine de ces répertoires... En définitive, il existe sur le Web de nombreux outils qui apportent un complément indispensable aux moteurs de recherche. Le tout est de savoir résister quelquefois à la Googlemania... *Barometre Xiti/1ère Position du mois de mai 2005 www.secrets2moteurs.com/barometre2005-05.html ** La même requête, posée à Yahoo et Dmoz, identifie respectivement 88 et 207 sites, parmi lesquels se trouvent un grand nombre d’associations, instituts, départements universitaires... |
|