|
La Chine est à l’honneur aujourd’hui et ses premiers pas dans
l’année du singe semblent se faire sous les meilleurs auspices…
Selon une étude de la banque d’affaires américaine Goldman Sachs,
dont les résultats ont été présentés dans le cadre du Forum
économique mondial de Davos, la Chine pourrait bien devenir la
deuxième puissance économique du monde – derrière les Etats-Unis –
d’ici 15 ans seulement et occuper la première place d’ici 2041 !
Les industriels se pressent donc pour investir en Chine, pays
considéré comme un nouvel eldorado économique…
Oui mais voilà, tout investissement passe par une phase préalable
de recherche d’informations, sur d’éventuels fournis-seurs ou
partenaires. Or, se renseigner sur une entreprise chinoise n’est
pas toujours chose aisée : outre le fait que la Chine n’est pas le
pays asiatique où l’information circule le mieux, on est souvent
confronté au problème de la langue, de nombreuses données
n’existant qu’en chinois !
Si l’Internet ne doit bien sûr pas être la seule source
d’information lors d’une telle investigation, le réseau des réseaux
peut néanmoins s’avérer utile. A la condition toutefois de penser à
certaines astuces…
A titre d’illustration, nous verrons dans cet article comment
obtenir un maximum de renseignements sur une société chinoise,
Futian Pharmacy.
"REFLEXE GOOGLE" : DESILLUSION AMERE
Le premier réflexe de nombre d’internautes pour répondre à une
question, quelle qu’elle soit, est de saisir les termes de la
requête dans la zone de saisie de Google et de cliquer sur le
bouton Recherche Google.
Suivent alors quelques secondes, pleines de l’espoir d’obtenir, en
première page de résultats, LE rapport tant souhaité sur la société
en question…
Cette tactique est quelquefois – trop rarement – efficace ; elle
permet en tout état de cause d’avoir une estimation du nombre de
pages sur le Web qui contiennent les termes de la requête et, en
fonction de ce nombre, d’affiner sa question ou de choisir une
autre famille d’outils.
Las, dans notre cas, la désillusion est amère. A la question
“Futian Pharmacy”, Google identifie neuf pages Web, parmi
lesquelles on trouve :
- quelques pages proposées par le site WorldFoodNet.com
(www.worldfoodnet.com), qui se définit comme “the online
gathering place for the international food processing and supply
industry”. Ce site est le produit d’une joint-venture entre
the Institute of Food Technologists (IFT), International
Association of Food Industry Suppliers (IAFIS) et the German
Agricultural Society (DLG) ; son objectif est d’offrir en ligne un
annuaire des fournisseurs et des acheteurs concernés par les
produits et services de l’industrie alimentaire. La société Futian
Pharmacy est bien recensée dans l’annuaire (son nom complet est
Yucheng Futian Pharmacy) ; le site nous donne son adresse … mais
rien d’autre. Il est toutefois possible d’envoyer un e-mail à cette
société ;
- un article, issu de Chemical Market Reporter (nov.
2001), nous apprend que la société Rochem International a signé un
partenariat avec la société chinoise, pour la fabrication de
polyols. Cette information est reprise sur le site de Rochem
International ;
- le nom – et seulement le nom – de la société Futian Pharmacy
apparaît dans la liste des exposants au salon World Dairy Expo
& Summit (Beijing, octobre 2003) ;
- enfin, la dernière page identifiée par Google est intéressante à
plus d’un titre. Proposée par le site brésilien
Greatfoodsbrasil.com, elle est écrite en portuguais mais son sens
reste compréhensible pour les francophones. Elle contient des
informations sur le polyol fabriqué par Futian, mais donne aussi
quelques renseignements utiles sur la société elle-même, comme la
superficie de l’usine, le nombre d’employés ou la production
annuelle. On remarque d’autre part que Google a affiché, entre
l’URL de la page et le lien En cache, la mention “Résultat
complémentaire”. Cela semble indiquer que Google interroge
désormais ses “index complémentaires” (voir Netsources n°45) depuis
l’interface en français. C’est une bonne nouvelle, mais on aimerait
en savoir plus sur ces sources. Dans son aide en ligne, Google se
contente en effet d’une explication laconique : “Résultat
complémentaire : Google augmente le nombre de résultats pour les
requêtes difficiles en cherchant dans un lot de pages web
complémentaire. Les résultats provenant de cet index sont en vert
et annotés “Complémentaire.”
Nous sommes donc ici dans le cas – plutôt rare sur Google – où
l’insatisfaction est engendrée par la pauvreté des résultats et non
par leur surabondance. La méthode à adopter est donc moins évidente
; s’il est aisé de rajouter des mots à une stratégie quand il y a
trop de réponses, il est difficile d’en ôter quand la requête ne
comporte que le nom de la société !
BASES CLASSIQUES : L'ENQUETE PIETINE
Afin d’avoir des éléments de comparaison, nous avons voulu savoir
ce que proposaient les grands serveurs classiques sur cette
entreprise. Nous avons donc interrogé les serveurs Factiva,
LexisNexis, Dialog, DataStar, STN, L’Européenne de Données et
Europresse. Hélas, les résultats ne sont pas plus probants. Deux
informations sont reprises par la plupart des serveurs : l’article
de Chemical Market Reporter et la présence de Futian Pharmacy comme
exposant dans un salon.
Dialog, avec ses 500 banques de données, nous offre néanmoins
quelques éléments supplémentaires :
- la base de Dun&Bradstreet (D&B Dun’s Market Identifiers,
fichier n°518) fournit ainsi quelques données financières de 2001 :
chiffre d’affaires, bénéfice, résultat net ;
- mais c’est Piers Imports (fichier n°573) qui donne les
renseignements les plus “originaux” ; cette base signale en effet
les entrées de cargo dans les ports maritimes américains (dix-huit
mois d’antériorité). On y apprend qu’entre mai et décembre 2003,
six cargo ont transporté des produits de Futian Pharmacy, à
destination d’entreprises américaines ; pour chaque mouvement, sont
indiqués le produit importé et son code, son conditionnement (type
– sacs, cartons...– et nombre), le nom de l’entreprise importatrice
et sa localisation, le port d’embarquement et de débarquement et la
date d’arrivée du cargo.
L'INVESTIGATION SE POURSUIT SUR LE NET
Les premiers éléments de la recherche laissent à penser qu’il y a
peu d’informations en ligne sur cette société, puisque ni Google ni
les bases classiques n’ont donné réellement satisfaction...
On a certes appris que Futian Pharmacy participait à des salons,
fabriquait et exportait (notamment vers les Etats-Unis) des
polyols, mais l’on n’en sait guère plus sur son activité, ses
usines, en dehors des quelques renseignements très pertinents
fournis par le site brésilien.
Quelles pistes peut-on suivre pour aller plus loin ?
Les serveurs classiques nous ont permis d’interroger une partie non
négligeable du Web invisible – Dialog et Lexis Nexis offrent tous
deux plus de 4 milliards de documents, soit l’équivalent chacun
d’un Google, composé uniquement de documents professionnels et
validés ! Il y a bien sûr de nombreuses autres sources, mais les
identifier et les interroger une à une risque d’être une tâche
longue et fastidieuse !
Google pour sa part a lancé sa requête sur le Web visible. Plus
précisément, sur la partie du Web visible qu’il indexe. Or, Google
annonce aujourd’hui interroger 4,2 milliards de pages, soit moins
de la moitié du Web visible..
Dans un cas comme celui-ci, il est donc impératif d’interroger
d’autres moteurs de recherche, qui auront une couverture
complémentaire. Pour ce type de question (basique, et donnant peu
de réponses), un métamoteur peut également se révéler un outil
approprié. Notre choix se porte dans un premier temps sur
AlltheWeb, le concurrent direct de Google, qui indexe plus de 3,1
milliards de pages.
- AlltheWeb : des pistes prometteuses
Une recherche sur AlltheWeb avec les mots “futian pharmacy”
identifie six pages. Si cinq d’entre elles ne font que reprendre
les informations déjà trouvées sur Google, la sixième est une bonne
surprise.
Disponible sur le site Show.agrisd.com, elle décrit en détail une
proposition de joint-venture de Futian Pharmacy pour la mise en
place d’une nouvelle ligne de production, d’une capacité annuelle
de 10 000 tonnes. Une analyse du marché des principaux produits
fabriqués est fournie, et les bénéfices économiques espérés sont
indiqués.
Dans le bas de la page, un lien permet d’afficher des données
complémentaires sur Futian Pharmacy. Et l’on obtient là de nombreux
renseignements : les prix qu’elle a remportés en Chine (the
Advanced Enterprise of the Food Industry of China...), le nombre
d’employés (et le nombre de techniciens et ingénieurs), les
capacités de production pour différents produits, etc.
A titre de vérification, nous avons interrogé Google avec la
requête site:show.agrisd.com, pour lister les pages de
ce site qu’il avait indexées*. Curieusement, 157 pages de ce site
sont présentes dans l’index de Google. Mais en fait, à quelques
exceptions près, seule l’URL de la page est affiché – sans titre ni
extrait –, la page de résultat indiquant par exemple :
show.agrisd.com/product/index1.asp?class1=25 Pages
similaires.
Le contenu de la page n’est pas (encore ?) indexé et un clic sur
l’URL affiche fréquemment un message d’erreur. Peut-être Google
a-t-il des difficultés à indexer certaines pages en format asp ?
AlltheWeb, quant à lui, n’a aucun problème pour indexer le contenu
des mêmes pages. Pour chacune, il indique le titre, la balise
description et l’URL. Et les requêtes portent bien sur le texte
intégral des pages.
... mais attention aux préférences
En regardant attentivement la page de résultats d’AlltheWeb, on
remarque toutefois que par défaut, la requête sur Futian Pharmacy
s’est effectuée sur les pages en anglais et en français.
Or, d’une façon générale – et a fortiori dans notre cas – il est
préférable de lancer ses recherches sur l’ensemble des pages Web
(ne serait-ce que pour obtenir la page en brésilien identifiée par
Google).
Sur AlltheWeb, il suffit de cocher l’option “Any
language” sous la zone de saisie (cette préférence peut être
enregistrée) et relancer la requête. On obtient alors quinze pages,
au lieu des six précédentes. Bizarrement, certaines des nouvelles
pages sont pourtant en anglais...
Ainsi, le premier résultat de la requête est une page intitulée
Newchems Website (www.newchems.com) ; elle donne accès
à un portail B2B – chinois mais en anglais – dans le domaine de la
chimie. Ce site offre une fiche descriptive sur Futian Pharmacy,
avec des données sur ses capacités de production, les produits
fabriqués et surtout ... l’adresse de son site Web
(www.xylitol-cn.com), qu’il faudra bien sûr explorer.
Les résultats d’AlltheWeb comprennent également la page issue de
Greatfoodsbrasil.com et de nombreuses pages en chinois. Au total,
AlltheWeb se montre donc pour cette requête plus performant que
Google. Mais surtout, cet exemple illustre bien qu’il est
impératif, dès qu’une recherche sur un moteur obtient peu de
réponses, d’élargir sa couverture du Web en interrogeant d’autres
moteurs.
- KillerInfo, les atouts d’un méta-moteur
Nous sommes ici dans la situation-type où un métamoteur peut
s’avérer efficace :
- la requête est très simple (un mot composé) ; elle devrait donc
être comprise sans ambiguïté par tous les outils interrogés ;
- le nombre de pages identifiées par les moteurs est faible ; le
métamoteur devrait donc être à même de les rapatrier toutes, qui
plus est en les dédoublonnant et en les triant, ce qui est un gain
de temps appréciable.
Nous avons choisi d’interroger ici KillerInfo (voir Netsources
n°39), un métamoteur qui possède des qualités incontestables. A la
requête “futian pharmacy”, KillerInfo identifie 26 pages.
En étudiant les résultats, on se rend compte toutefois que la
sélection comprend quelques doublons ; ainsi, des pages identiques,
indexées par des outils différents, n’ont pas été dédoublonnées par
le métamoteur. Au total, sur les 26 pages, seules deux n’ont été
identifiées ni par AlltheWeb ni par Google. L’une reprend le résumé
de l’article de Chemical Market Reporter (le texte intégral est
accessible sur abonnement) ; l’autre en revanche est beaucoup plus
intéressante :
14. ¶Ó-·ÃÎÊÓí∏ÇÒ©Òµ.. Óí∏Ǹ£ÌïÒ©Òµ.. URL:
http://www.xylitol-cn.com/... Sources: GigaBlast 1
C’est en fait la page d’accueil du site de Futian Pharmacy (que
l’on avait déjà identifié), dont le titre est fort peu engageant
car ... écrit en chinois. Comme le navigateur ne peut afficher les
idéogrammes, ceux-ci sont remplacés par des signes cabalistiques.
Et ce n’est qu’en se connectant au site que l’on découvre qu’il
propose une version en chinois, mais aussi une autre en anglais.
EXPLORATION D'UN SITE CHINOIS
La page d’accueil du site affiche uniquement le nom de
l’entreprise, avec un lien vers les versions en anglais et en
chinois. Un clic sur English donne accès à une page de présentation
de la société, qui reprend globalement les informations que l’on a
pu trouver dans les diverses sources : prix décernés, capacités de
production par produits... Les projets de l’entreprise – notamment
ceux concernant de nouvelles lignes de production, avec leurs
capacités – sont également indiqués.
Une rubrique News donne accès à deux communiqués de
presse. Le premier (mai 2003) fait état d’une communication
scientifique américaine attestant les bénéfices pour la santé du
polyol, fabriqué notamment par Futian Pharmacy. Le second, de mai
2003 également, est du même type. Ces informations sont certes
encou-rageantes pour l’avenir de Futian Pharmacy, mais elles sont
beaucoup trop générales ; aucune information plus récente n’est
disponible sur le site.
La question que l’on peut alors se poser est la suivante : cette
version du site de Futian Pharmacy est-elle la traduction en
anglais du site en chinois, ou n’en est-elle qu’une version
“simplifiée”... Autrement dit, n’y aurait-il pas sur la version en
chinois des actualités plus récentes et, si oui, comment en prendre
connaissance, si l’on n’a pas de collaborateur lisant couramment le
chinois – et disposant d’un ordinateur avec toutes les polices
nécessaires pour l’affichage ! –.
ALTAVISTA BABEL FISH : UN OUTIL PRECIEUX
Pour les internautes qui ne disposent ni des polices adéquates ni
du lecteur-traducteur, un outil fort sympathique – et qui plus est
gratuit – peut s’avérer utile : le service de traduction offert par
AltaVista. Ce service est disponible à l’adresse
http://babelfish.altavista.com, ou en cliquant sur le lien
Traduction proposé sur l’écran d’accueil d’AltaVista**.
Il permet de traduire un bloc de texte (avec un maximum de 150
mots) ou, plus intéressant, le contenu d’une page Web, en
choisissant les langues d’origine et de destination depuis un menu
déroulant.
On y trouve notamment les options “du chinois vers l’anglais”, mais
aussi du coréen, du russe ou du japonais vers l’anglais. Certes, il
est important de rappeler qu’il s’agit ici de traduction
automatique (technologie Systran) et que les informations fournies
sont par conséquent très “approximatives”. Il peut y avoir en effet
des contresens, des traduc-tions inappropriées de noms propres,
etc. Néanmoins, ces traductions permettent le plus souvent de
comprendre le sens général d’un article et de voir s’il justifie
une traduction “humaine” ou non...
Dans notre cas, en se connectant à la version en chinois du site de
Futian Pharmacy et en cliquant sur l’onglet News –
enfin sur le bouton situé au même endroit que l’onglet News de la
version en anglais – on s’aperçoit vite que la rubrique offre cinq
communiqués (et non deux), le plus récent datant de décembre 2003.
Il suffit alors de copier-coller l’URL dans la zone appropriée de
BabelFish et de choisir les langues de départ/destination pour
obtenir des traductions certes grossières des communiqués, mais qui
permettent incontestablement d’en savoir plus sur la société (et
notamment qu’elle a investi dans le développement d’un centre de
R&D).
Le même principe peut d’ailleurs être appliqué aux nombreuses pages
en chinois identifiées par AlltheWeb. L’une en particulier,
proposée par le Department of Foreign Trade and Economic
Cooperation of Shandong Province, est riche d’informations sur
l’usine...
Au total, ces quelques “trucs et astuces” démontrent, s’il en était
besoin, que l’utilisation combinée de plusieurs outils de recherche
s’avère indispensable, dès lors que le premier n’a pas donné
satisfaction...
Cela étant, l’enquête n’est pas close pour autant ! D’autres
méthodes de recherche pourraient permettre d’en savoir plus sur la
société. L’exploration du Web invisible – et notamment des titres
de presse chinoise – pourrait ainsi se révéler fructeuse.... Mais
ceci est une autre histoire...
*Depuis fin janvier 2004, l’opérateur site: – suivi d’une URL
– peut être utilisé seul sur Google ; il permet de lister
l’ensemble des pages indexées par le moteur pour un site donné.
Auparavant, il ne pouvait être utilisé qu’en complément d’une
requête par mot-clé. Cet opérateur peut également être employé seul
sur AlltheWeb.
**On notera que ce service de traduction est offert sur la
Toolbar d’AltaVista (voir Netsources n°45).
|