Netsources, Numéro de Novembre-Décembre 2006 - n°65


Technorati.com : la recherche de blogs à la loupe

On sait désormais que la blogosphère peut constituer une source d’information de grande valeur. Il est possible d’y trouver des renseignements sur des sociétés, des marques ou des produits qui ne seront pas relayées par les médias traditionnels et qui seront utiles aussi bien dans le cadre d’une étude d’image que dans celui d’une veille concurrentielle, ou tout simplement pour suivre l’actualité d’un domaine. ...

Auteur : Jennifer Clerté

Certains blogs permettent ainsi de surveiller et de mieux comprendre les habitudes, avis, besoins, désirs et préoccupations des consommateurs, ou encore de détecter les tendances émergeantes.

Si l’intérêt de cette source est désormais tenu pour acquis, le blog à valeur ajoutée reste malgré tout aussi difficile à retrouver qu’une aiguille dans une meule de foin.
Pour un blog d’expert en effet, on compte plusieurs milliers de blogs d’adolescents pré-pubères ou de passionnés de Star Wars. 

Tout comme la recherche de pages web, la recherche sur les blogs doit donc être formulée de la façon la plus précise possible. Pour cela on conseillera d’utiliser un moteur de recherche limité aux blogs.
 
L’un des premiers moteurs de blogs fut ainsi Technorati, qui indexe aujourd’hui les billets de plus de 63 millions de blogs.
D’autres moteurs, tels Google Blogsearch et Ask.com (module Blogs et Flux, voir Netsources n°62), sont beaucoup plus discrets sur le nombre de blogs indexés, mais l’on remarque que pour la plupart des recherches, ils affichent pourtant un nombre de résultats supérieur à celui de Technorati (une requête sur Aventis obtient ainsi 9 403 résultats sur Technorati, 20 500 sur Ask.com et 23 769 sur Google Blogsearch). Cela étant, il faut savoir que sur la blogosphère comme sur le Web, le  nombre de  résultats indiqué par les moteurs est souvent très approximatif...

Ces différents moteurs permettent d’effectuer des recherches sur tout ou partie de la blogosphère et offrent des fonctionnalités pour limiter les résultats aux blogs les plus pertinents et/ou les plus populaires.

En partant de l’exemple de Technorati et en le comparant à ses deux principaux concurrents, nous présenterons dans cet article les différentes fonctionnalités existantes pour mener une recherche efficace sur les blogs.
Rappelons tout d’abord qu’à l’instar du moteur de pages web, le moteur de blog indexe les pages de tous les blogs qu’il a identifiés et permet donc de lancer une recherche par mots sur le contenu des billets (ou posts) publiés sur ces blogs.

Si l’on souhaite en revanche identifier des blogs (et non des billets), il faudra plutôt interroger un annuaire de blogs – tels Blogarama.com ou Blogs-Collection.com –, de la même façon que l’on utilise un annuaire de sites pour retrouver des sites web sur un sujet donné.

Lorsque l’on recherche une information précise pouvant être diffusée par un blogger, l’utilisation d’un moteur s’avère appropriée.

Cependant, lorsque l’on sait qu’environ 1,3 million de nouveaux billets sont publiés chaque jour dans la blogosphère (données de l’étude State of the Blogosphere 10/06, Technorati), on imagine le risque de se retrouver noyé par les résultats. D’où la nécessité de préciser sa question autant que possible.

DIVERSES POSSIBILITES DE RECHERCHE


Les moteurs de blogs offrent en général plusieurs modes de recherche, permettant différents degrés de précision.

• la recherche sur les posts
Technorati permet ainsi de lancer une requête par mots sur son index, en utilisant les opérateurs booléens (AND, OR, NOT) et les guillemets, pour rechercher une expression exacte.
Le module de recherche avancée propose davantage d’options, comme de limiter sa requête à un blog précis ou aux blogs spécialisés sur un sujet (“blogs about”).
Autre fonctionnalité, plus originale, Technorati permet de retrouver tous les blogs pointant vers un site donné (équivalent à la fonction link: des moteurs).
Enfin, après avoir lancé sa question, il est possible de filtrer les résultats selon la langue des billets.

Google Blogsearch offre pour sa part des opérateurs spécifiques pour la recherche sur les blogs : inblogtitle: lance la requête sur le titre des blogs ; inposttitle: la limite aux titres des billets ; inpostauthor: permet d’identifier un auteur de posts particulier et blogurl: limite la recherche à l’URL des blogs. Au sein de la recherche avancée, on peut aussi restreindre la requête aux billets publiés dans une période donnée, ou dans une langue particulière.

Ask.com pour sa part dispose, dans son module Blogs et Flux, d’une grille de recherche avancée sur les billets tout à fait intéressante. Il est en effet possible de limiter la requête aux champs suivants : titre, nom de l’auteur, texte, sujet, description, URL et citation.
Dans ce dernier cas, la recherche se fait sur les liens hypertextes proposés dans les billets. Cette fonctionnalité correspond à l’ancien opérateur “anchor” sur AltaVista, et permet de repérer aisément les blogs qui ont parlé de tel site ou de tel billet ; l’usage sera de même type que ce que propose Technorati (blogs pointant vers un site).
Mais Ask.com va encore plus loin en permettant d’ajouter autant de “lignes”  de commande que l’on veut, afin de combiner la recherche dans les différents champs.
Ask.com propose enfin, comme Google Blogsearch, de préciser une période de recherche et la langue des résultats.

• la recherche sur les tags
Afin de limiter sa requête à des billets qui porteront sur le domaine de recherche et exclure ainsi les résultats non pertinents, il peut être intéressant d’utiliser la recherche sur les tags. Rappelons que les tags sont des mots-clés attribués (de façon facultative) par le blogger, pour caractériser le contenu de ses billets.
L’avantage revient ici à Technorati, qui est le seul moteur à proposer cette possibilité (il annonce indexer aujourd’hui plus de 12 millions de tags).

• la recherche sur le “Blog Directory”
Parallèlement à son moteur, Technorati propose désormais un annuaire de blogs, qui permet de retrouver des blogs spécialisés sur un thème donné.
La recherche se fait par mots depuis la page d’accueil, en précisant, dans le menu déroulant, “In Blog directory”.
La page de résultats affiche la liste des blogs pertinents avec pour chacun leur nom et leur URL, les principaux tags et le nombre de citations (blogs pointant vers le blog indiqué), ce qui permet de repérer les sources les plus populaires.
Sur la gauche de l’écran, une colonne propose de consulter les blogs classés dans de grandes rubriques (Art, Blog, Books, Business, Design, Internet, Media, Politics, Software, Technology...), puis d’affiner la sélection via les tags de ces blogs.

• la recherche sur les blogs favoris
Les internautes disposant d’un compte sur Technorati peuvent créer leur groupe de blogs favoris. Ils peuvent ensuite choisir de limiter leur recherche à ces favoris. Cette fonction est très intéressante lorsque l’on suit un très grand nombre de blogs.
Elle a également l’avantage de limiter la requête à une liste de blogs dont on aura préalablement validé l’intérêt et le sérieux.

LES FONCTIONS DE FILTRAGE ET DE CLASSEMENT DES RESULTATS


Au delà des possibilités de recherche avancée, les fonctions de filtrage des résultats constituent un moyen supplémentaire de limiter le nombre de réponses et d’augmenter leur taux de pertinence.

• l’analyse sémantique
Comme d’autres moteurs classiques tels Exalead, Technorati propose de filtrer une première liste de résultats en ajoutant à la requête initiale des termes associés.
Lors d’une recherche, par exemple, sur le mot Library dans tous les billets de blogs, Technorati propose d’affiner la requête avec les termes associés suivants : Books, Libraries, javascript, web, work google, library 2.0, technology, blogging, librarian.  Un clic sur l’un des mots le rajoute à la requête initiale avec l’opérateur AND.
A notre connaissance, Technorati est pour le moment le seul moteur de blog à proposer une telle fonction.

• la popularité des blogs
Un filtre dit “d’autorité” a été récemment ajouté à Technorati. Il permet de filtrer les résultats obtenus lors d’une première recherche en ne retenant que les posts de blogs ayant “un peu d’autorité” (a little), “quelque autorité” (some) ou “beaucoup d’autorité” (a lot of).

Ici, l’autorité d’un blog est mesuré en fonction du nombre de blogs pointant vers lui. L’intérêt n’est plus d’augmenter la pertinence des résultats, mais de ne retenir que ceux issus de blogs reconnus par leurs pairs.

Google Blogsearch ne dispose pas de ce type de filtre.
Cependant, il offre deux modes de classement : par pertinence – qui est le mode par défaut – ou par date de publication du billet.

Ask.com propose pour sa part trois modes de classement : par pertinence, par popularité (sur la base des liens pointant vers le blog) ou par date.

• en savoir plus sur la source
Technorati offre un dernier moyen de filtrer des résultats, mais cette fois de façon manuelle. En cliquant sur le nom du blog dont est issu le post trouvé, on affiche des informations permettant d’évaluer la pertinence et la valeur ajoutée de ce résultat, à savoir son niveau de classement (rank), basé sur le nombre de liens pointant vers lui, en corrélation avec le nombre de blogs dont sont issus ces liens. Le moteur indique aussi la date de la dernière mise à jour du blog et le nombre d’internautes qui l’ont ajouté à leurs favoris.
Sur la base de ses informations, on peut alors décider d’enregistrer le blog dans ses propres favoris.

LES FONCTIONS DE SURVEILLANCE


Etant donné la fréquence de mise à jour des blogs, il s’avére souvent nécessaire de les surveiller pour être sûr de ne pas rater un billet intéressant.

Pour cela Technorati propose deux fonctionnalités :

• il offre la possibilité, désormais assez répandue, de générer un fil RSS pour toute recherche effectuée. Une fois l’adresse du flux enregistrée dans un lecteur RSS, l’utilisateur sera informé de tout nouveau post sur le sujet qu’il suit.
Google Blogsearch offre également cette même fonction, de même que Ask.com, qui propose en plus de publier les billets trouvés directement sur son propre blog (pour les utilisateurs de Bloglines ou de Blogger) ou de les ajouter à ses favoris via des sites de favoris de blogs, tels que Blogmarks ou Mesfavs.
On notera également que le service d’alerte de Google propose, depuis la version internationale seulement (www.google.com/alert), d’enregistrer une requête dans Google Blogsearch et de recevoir les nouveaux billets par mail.

• Technorati a développé un autre petit outil appelé Technorati Mini, qui permet de suivre une requête grâce à une fenêtre pop-up ouverte sur le bureau de son ordinateur. Mais ce pop-up ne peut malheureusement suivre qu’une requête à la fois. La requête devra par ailleurs être relancée sur Technorati pour rouvrir le pop-up, lorsque celui-ci a été fermé. Cet outil n’est donc utile que pour les surveillances très ponctuelles.

En définitive, chacun de ces outils dispose de fonctionnalités originales pour parvenir à des résultats pertinents. Leur couverture étant forcément quelque peu différente, la consultation de plusieurs moteurs est souvent utile. Par ailleurs, les différents modes de recherche proposés par les uns ou les autres s’avèrent plutôt complémentaires.

On retiendra ainsi :

• la recherche avancée d’Ask.com, qui dispose d’un grand nombre de champs différents (titres, auteur, texte, citation…)  et permet d’associer plusieurs étapes de requêtes ;

l’utilisation des tags proposée par Technorati, qui offre un bon moyen de limiter sa recherche à des blogs d’un domaine précis. Il appartient du fait de cette fonctionnalité à l’univers du Web 2.0.

• Google Blogsearch enfin, qui a pour sa part l’avantage d’appartenir à la sphère Google et de pouvoir être associé aux autres outils de la gamme du géant.
Google News propose ainsi depuis peu de relancer, sur Google Blogsearch, une recherche préalablement effectuée sur les actualités. Cette association des deux services a d’ailleurs contribué à augmenter fortement le trafic de Google Blogsearch, qui se place désormais devant Technorati.