Actualités
Agenda
Liens utiles
Netsource
Netsource - Sommaire en cours
Netsource - Anciens sommaires
Netsource - Recherche des archives
Revue Bases
Revue Bases - Sommaire en cours
Revue Bases - Anciens sommaires
Revue Bases - Recherche des archives
Ouvrages
Qui sommes-nous ?
Notre équipe
Accueil > Netsources > Anciens sommaires > Outils de recherche

Netsources, Numéro de Janvier-Février 2002 - n°36


Outils de recherche

une actualité toujours aussi dense...

Auteur : Béatrice Fonenix-Riou

 
La société Divine Inc., fournisseur de solutions intégrées, a annoncé en janvier 2002 qu’elle avait racheté Northern Light, dont elle détenait la majorité des actifs.
   
La société Northern Light a dans le même temps indiqué qu’elle avait décidé de se focaliser sur l’intégration des solutions de recherche et de contenus pour les entreprises clientes. Par conséquent, elle prévoyait de supprimer la possibilité d’effectuer des recherches en accès libre sur le Web à compter du 16 janvier, réservant cette offre aux abonnés. Néanmoins, le site devait toujours permettre d’interroger, sans abonnement, la Special Collection (qui contient plus de 70 millions de documents issus de 7 100 sources) et les différents dossiers thématiques.
   
Bonne nouvelle pour les netsurfers, l’accès aux recherches sur le Web est, temporairement du moins, toujours proposé en accès libre.
   
Il l’est toutefois de façon fort discrète, puisqu’il faut pour y accéder cliquer sur le lien énigmatique NL Research qui figure en bas du nouvel écran d’accueil de Northern Light. 
   
On peut également accéder directement à cette grille de recherche depuis l’adresse www.nlresearch.com.
   
Comme par le passé, il est possible de lancer des requête sur le Web, la Special Collection, toutes les sources de Northern Light, de profiter des grilles de recherche spécifiques (avancée, sur les actualités, etc.) et de mettre en place des alertes.
   
On ne peut que conseiller à nos lecteurs de profiter de ce moteur performant tant qu’il est en accès libre... Cela ne saurait durer...
   

POSITIONNEMENT PAYANT : LE PRINCIPE FAIT DES EMULES

   
Le principe du positionnement payant semble gagner du terrain ces derniers temps. La société Espotting — qui concurrence Overture sur le marché européen pour les mots-clés vendus aux enchères (voir Netsources n°33) —, a ainsi signé des accords avec Lycos et HotBot (les cinq premiers liens d’Espotting apparaissent dans les résultats), AltaVista, Nomade et Yahoo! France.
   
Pour Nomade par exemple, les deux premiers résultats d’Espotting apparaissent en haut de la liste, dans un encadré gris avec la mention Sponsoring.
   
Plus original, Espotting a également signé des accords avec ... le métamoteur Copernic. Ce dernier intègre désormais les cinq premiers liens d’Espotting, qui sont affichés comme les résultats des autres outils, mais pas forcément en haut de la page. Espotting est considéré comme un outil de recherche à part entière, à la nuance près qu’il est impossible de le désactiver dans la liste des outils à interroger (Paramètres de l’assistant de recherche) !
   
Google a également suivi l’exemple et la mode des enchères, en modifiant le principe des Adwords. Ces petits encadrés, qui s’affichaient à droite des résultats, étaient jusqu’ici facturés selon un système prenant en compte le nombre d’affichage de la publicité (principe du CPM — Coût par Mille).
   
Google offre désormais en complément le programme AdWords Select, basé sur le principe du CPC (Coût par Clic) ; l’annonceur indique le prix maximum qu’il est prêt à payer ; le coût final est fonction d’un système d’enchères et du nombre de clics sur le lien.
   
D’après Google, ce système permet à de très petites entreprises de devenir annonceurs.
   
Enfin, Misterbot a fait son apparition sur ce marché (www.misterbot.com). Cet outil français utilise la base de l’Open Directory et sa propre base de sites Web ; il permet de référencer un site à partir de mots-clés vendus aux enchères (CPC).
L’écran d’accueil affiche, comme tout annuaire, une liste de rubriques et de sous-rubriques. Une recherche par mots sur les descriptions de sites (et les mots-clés achetés !) est possible ; on obtient la liste des sites sélectionnés par l’Open Directory, surmontés de la liste des sites des annonceurs...
   
Après quelques étonnements et indignations, le principe de l’achat de mots-clés semble entrer dans les us et coutumes...
   

GOOGLE : ACCENTS OR NOT ACCENTS ?

   
La prise en compte — ou non — des caractères accentués est l’une des composantes de la syntaxe d’interrogation des moteurs ; elle varie grandement selon les outils, mais peut aussi changer pour un outil dans le temps.
   
A ses débuts, Google avait ainsi choisi la politique de l’occurrence exacte, comme All The Web ou HotBot ; le moteur ne sélectionnait donc que les pages contenant les mots tels qu’ils étaient écrits par l’internaute. Il a ensuite préféré, comme Voila et Northern Light, l’insensibilité aux accents ; les mots saisis avec ou sans accentuation donnaient donc les mêmes résultats.
   
Il semble que depuis peu, Google ait de nouveau modifié sa politique.
   
Si l’aide en ligne indique que “par défaut, les recherches de Google ne tiennent pas compte des accents”, les quelques comparaisons que nous avons effectuées montrent que cette affirmation n’est pas exacte. La saisie de termes avec et sans accents ne donne en effet pas les mêmes résultats, mais les règles adoptées sont difficilement définissables.
   
Une chose est certaine : il n’a pas choisi la troisième option que l’on rencontre sur les outils de recherche (AltaVista ou Yahoo notamment), à savoir : les requêtes saisies sans accents sélectionnent toutes les occurrences ; si les mots-clés sont accentués, seuls les mots accentués sont sélectionnés.
   
La solution de Google serait plus proche de l’inverse, puisque les requêtes sur des termes accentués donnent généralement plus de résultats que sur des termes non accentués.
   
Pour illustrer les variations dans les réponses, nous avons choisi de faire des tests sur un mot accentué relativement “obscur” (cela afin de vérifier plus facilement la pertinence des sélections) : “élasticimétrie” : mesure des contraintes subies par un corps et des déformations qui en résultent (Petit Larousse).
   
Nous avons donc comparé les pages identifiées pour les différentes orthographes possibles du mot, puis les sélections obtenues lorsque le mot était précédé du symbole +, qui signifie (sur Google) que le mot doit être recherché tel qu’il est écrit.
   
On trouvera ci-après, dans la première colonne, le nombre de réponses données pour chaque requête et, dans la seconde, le nombre de sélections ne correspondant pas strictement à la requête.
   
L’interface utilisée était Google France, avec l’option Recherche sur le Web.

- élasticimétrie :  16 - 3
- +élasticimétrie : 13 - 0
- elasticimetrie :   3 - 0
- +elasticimetrie :  3 - 0
- élasticimetrie :   3 - 3
- +élasticimetrie :  0 - 0
- elasticimétrie :   6 - 3
- +elasticimétrie :  3 - 0

Des tests sur des mots accentués plus courants confirment cette tendance, et soulignent les différences importantes qu’il peut y avoir selon l’interface interrogée (Google.fr ou .com) :

On trouvera ci-après les résultats sur l’interface en .fr puis sur celle en .com :

- éléphant :  146 00  - 48 200
- +éléphant :  48 200 - 48 200
- elephant : 144 000 - 1 310 000
- +elephant : 1 310 000 - 1 310 000
- élephant : 118 000 - 417
- +élephant : 417 - 417
- eléphant : 145 000 - 7 020
- +eléphant : 7 020 - 7 020
Voila qui donne à réfléchir...


 

Version imprimable
BASES PUBLICATIONS
27, rue de la Vistule
75013 Paris
Tél. : 01.45.82.75.75
contact@bases-publications.com
Abonnez-vous   |   Contact   |   Mentions légales |   Crédits