|
Netsources, Numéro de Mai-Juin 2005 - n°56 MSN Search : un moteur à prendre en considérationLe moteur MSN Search – lancé en version bêta en novembre 2004 et de façon officielle en février 2005 – offrait jusqu’ici des possibilités de recherche originales, mais incomplètes.
|
Auteur : Béatrice Foenix-Riou |
|||
|
Plus original, MSN offrait des possibilités de jouer sur le
classement des résultats, en indiquant grâce à de petits curseurs
l’importance accordée à la fréquence de mise à jour, à la
popularité, ou encore à la “correspondance” (approximative ou
exacte) avec les mots de la requête.
En revanche, des critères à notre avis indispensables comme la recherche sur le titre, l'URL ou le type de fichiers, n'étaient pas proposés ... et nous avions jugé ces limites rédhibitoires ! Fort heureusement, MSN Search vient d’apporter des améliorations notables à son outil, qui comprend depuis la fin du mois de juin de nouveaux opérateurs : - comme sur Google et Yahoo!, les opérateurs intitle: et inurl: permettent respectivement de limiter la requête aux titres et aux URLs des pages ; - filetype: quant à lui restreint la recherche selon le type de fichier ; les formats disponibles sont pdf, html et txt, ainsi que les formats de la gamme Office : doc, ppt, xls et rtf ; - contains: propose d’identifier des pages qui offrent un lien vers un certain type de fichier ; contains:wmv localisera par exemple des pages offrant un fichier vidéo, quand contains:rss sélectionnera celles qui proposent un flux RSS. Cet opérateur, qui peut être combiné avec un mot ou un autre opérateur (par exemple “moteurs de recherche” contains:rss), complète filetype: en offrant à l’internaute la possibilité de repérer des fichiers – ou des flux RSS dans cet exemple – dont le contenu n’est pas indexé par le moteur ; c’est à notre connaissance le seul outil à offrir une telle fonctionnalité ; - inanchor: recherche un mot dans le contenu textuel des liens. Cette possibilité est fort utile pour retrouver notamment des pages de liens ; on peut en effet raisonnablement penser que des pages qui offrent un hyperlien contenant les mots “moteurs de recherche” par exemple, peuvent donner accès à des listes de moteurs de recherche... Cette fonctionnalité fut un temps offerte par AltaVista (anchor:) et AlltheWeb (via les menus déroulants de sa grille de recherche avancée), mais a disparu lors du basculement des moteurs sur la plate-forme Yahoo! Search Technology. Google quant à lui indiqua pendant un temps, dans la "Complete List of Advanced Operators" qu'il propose dans son aide sur Google.com (www.google.com/intl/en/help/operators.html), que les opérateurs inanchor: et allinanchor: permettaient de retrouver des mots dans les hyperliens. Ces opérateurs ont été supprimés de la liste actuelle, mais Google semble toutefois les comprendre toujours, mêmes si leur fonctionnement reste aléatoire (de nombreux résultats ne sont pas pertinents). On notera que sur MSN, l’opérateur inanchor: – comme inurl: d’ailleurs – ne comprend pas les expressions. On écrira donc inanchor:bases inanchor:publications pour identifier les pages contenant ces mots dans un lien. Mais sur MSN comme sur Google, nos tests ont donné des résultats peu probants... - inbody: recherche dans le texte des pages (équivalent de l’opérateur intext: sur Google) ; - site: limite la recherche à un nom de domaine donné (site:gouv.fr) ou à un site particulier (site:industrie.gouv.fr) ; cette fonctionnalité est offerte par la plupart des moteurs ; - linkdomain: complète l'opérateur link: en permettant d'identifier tous les liens qui pointent non vers une page, mais vers un site dans son ensemble. Comme sur Yahoo!, cet opérateur peut être combiné avec d'autres mots ou opérateurs. Pour identifier par exemple tous les liens externes pointant vers un site Web, on écrira : linkdomain:bases-publications.com -site:bases-publications.com (afin de supprimer des résultats les liens internes au site). On notera que sur ce point, Google est "à la traîne" des autres moteurs, puisqu'il ne propose que l'opérateur link:, qui fonctionne très mal et qui ne peut être utilisé que seul. Ces améliorations placent donc MSN au niveau de Google et de Yahoo!, sur le plan des possibilités de recherche tout au moins. Les fonctionnalités offertes par les trois moteurs sont similaires, à quelques détails près. Elles restent dans l’ensemble en-deçà de celles d’Exalead (voir Netsources n°54), qui est le seul à permettre l’utilisation d’un opérateur de proximité (NEAR) ou de la troncature. En ce qui concerne la taille de l’index de ces moteurs – ou tout au moins la taille de leur index “annoncé” –, Google garde une légère avance avec 8 milliards de pages, suivi par Yahoo! (6 milliards) et MSN (5 milliards). Mais il faut savoir que le nombre de résultats affiché par Google est quelquefois surestimé (voir Netsources n°54) et qu’en tout état de cause, la différence de taille entre les index de ces moteurs n’est un critère important que pour les questions qui obtiennent très peu de réponses, ce qui est relativement peu fréquent. Nous avons effectué quelques tests sur les trois moteurs en comparant, pour des sites d’importance et de notoriété variable, le nombre de backlinks – en utilisant l’opérateur link: (puisque Google ne propose pas linkdomain:) –, la “profondeur” de l’indexation (nombre de pages indexées pour chaque site – opérateur site:), ainsi que la fraîcheur des indexations (MSN et Google indiquent la date d’indexation dans leurs versions Cache). Il ressort de ces tests que MSN Search se comporte tout à fait honorablement sur ces trois points : - en matière de backlinks identifiés, il obtient en général un nombre de résultats inférieur à celui de Yahoo! – sauf pour certains sites de moindre importance – mais nettement supérieur à celui de Google, qui répond très mal à cette question ; - en matière de “profondeur d’indexation” d’un site, il se situe en général légèrement derrière Google et Yahoo! (qui ont des résultats assez proches), mais il indexe certains sites – peut-être plus complexes – beaucoup mieux que les deux autres moteurs... - en matière de “fraîcheur d’indexation” enfin, il n’a rien a envier à Google et les versions Cache des multiples pages consultées dataient le plus souvent de quelques jours à trois semaines maximum... Bref, MSN Search est aujourd’hui un moteur à prendre en considération. Il lui reste encore à s’améliorer sur deux points : - la version Cache des pages ne surligne pas en couleur les mots de la requête, comme le font Google et Yahoo!... Un détail qui a son importance... - plus grave – car plus difficile à corriger : MSN Search se défend assez mal contre le spamindexing et des pages offrant “les meilleures promos de voyage” arrivent à se placer pour des requêtes sur l’élasticimétrie... Mais ce moteur est encore jeune, et l’on peut penser qu’il devrait se bonifier au fil des mois... http://search.msn.fr http://search.msn.com
|
||||