Actualités
Agenda
Liens utiles
Netsource
Netsource - Sommaire en cours
Netsource - Anciens sommaires
Netsource - Recherche des archives
Revue Bases
Revue Bases - Sommaire en cours
Revue Bases - Anciens sommaires
Revue Bases - Recherche des archives
Ouvrages
Qui sommes-nous ?
Notre équipe
Accueil > Netsources > Anciens sommaires > Investigation sur des sociétés en Chine

Netsources, Numéro de Janvier-Février 2004 - n°48


Investigation sur des sociétés en Chine

Auteur : Béatrice Foenix-Riou

 
La Chine est à l’honneur aujourd’hui et ses premiers pas dans l’année du singe semblent se faire sous les meilleurs auspices… Selon une étude de la banque d’affaires américaine Goldman Sachs, dont les résultats ont été présentés dans le cadre du Forum économique mondial de Davos, la Chine pourrait bien devenir la deuxième puissance économique du monde – derrière les Etats-Unis – d’ici 15 ans seulement et occuper la première place d’ici 2041 !

Les industriels se pressent donc pour investir en Chine, pays considéré comme un nouvel eldorado économique…

Oui mais voilà, tout investissement passe par une phase préalable de recherche d’informations, sur d’éventuels fournis-seurs ou partenaires. Or, se renseigner sur une entreprise chinoise n’est pas toujours chose aisée : outre le fait que la Chine n’est pas le pays asiatique où l’information circule le mieux, on est souvent confronté au problème de la langue, de nombreuses données n’existant qu’en chinois !

Si l’Internet ne doit bien sûr pas être la seule source d’information lors d’une telle investigation, le réseau des réseaux peut néanmoins s’avérer utile. A la condition toutefois de penser à certaines astuces…
A titre d’illustration, nous verrons dans cet article comment obtenir un maximum de renseignements sur une société chinoise, Futian Pharmacy.

"REFLEXE GOOGLE" : DESILLUSION AMERE


Le premier réflexe de nombre d’internautes pour répondre à une question, quelle qu’elle soit, est de saisir les termes de la requête dans la zone de saisie de Google et de cliquer sur le bouton Recherche Google.
Suivent alors quelques secondes, pleines de l’espoir d’obtenir, en première page de résultats, LE rapport tant souhaité sur la société en question…

Cette tactique est quelquefois – trop rarement – efficace ; elle permet en tout état de cause d’avoir une estimation du nombre de pages sur le Web qui contiennent les termes de la requête et, en fonction de ce nombre, d’affiner sa question ou de choisir une autre famille d’outils.
Las, dans notre cas, la désillusion est amère. A la question “Futian Pharmacy”, Google identifie neuf pages Web, parmi lesquelles on trouve :

- quelques pages proposées par le site WorldFoodNet.com (www.worldfoodnet.com), qui se définit comme “the online gathering place for the international food processing and supply industry”. Ce site est le produit d’une joint-venture entre the Institute of Food Technologists (IFT), International Association of Food Industry Suppliers (IAFIS) et the German Agricultural Society (DLG) ; son objectif est d’offrir en ligne un annuaire des fournisseurs et des acheteurs concernés par les produits et services de l’industrie alimentaire. La société Futian Pharmacy est bien recensée dans l’annuaire (son nom complet est Yucheng Futian Pharmacy) ; le site nous donne son adresse … mais rien d’autre. Il est toutefois possible d’envoyer un e-mail à cette société ;

- un article, issu de Chemical Market Reporter (nov. 2001), nous apprend que la société Rochem International a signé un partenariat avec la société chinoise, pour la fabrication de polyols. Cette information est reprise sur le site de Rochem International ;

- le nom – et seulement le nom – de la société Futian Pharmacy apparaît dans la liste des exposants au salon World Dairy Expo & Summit (Beijing, octobre 2003) ;

- enfin, la dernière page identifiée par Google est intéressante à plus d’un titre. Proposée par le site brésilien Greatfoodsbrasil.com, elle est écrite en portuguais mais son sens reste compréhensible pour les francophones. Elle contient des informations sur le polyol fabriqué par Futian, mais donne aussi quelques renseignements utiles sur la société elle-même, comme la superficie de l’usine, le nombre d’employés ou la production annuelle. On remarque d’autre part que Google a affiché, entre l’URL de la page et le lien En cache, la mention “Résultat complémentaire”. Cela semble indiquer que Google interroge désormais ses “index complémentaires” (voir Netsources n°45) depuis l’interface en français. C’est une bonne nouvelle, mais on aimerait en savoir plus sur ces sources. Dans son aide en ligne, Google se contente en effet d’une explication laconique : “Résultat complémentaire : Google augmente le nombre de résultats pour les requêtes difficiles en cherchant dans un lot de pages web complémentaire. Les résultats provenant de cet index sont en vert et annotés “Complémentaire.

Nous sommes donc ici dans le cas – plutôt rare sur Google – où l’insatisfaction est engendrée par la pauvreté des résultats et non par leur surabondance. La méthode à adopter est donc moins évidente ; s’il est aisé de rajouter des mots à une stratégie quand il y a trop de réponses, il est difficile d’en ôter quand la requête ne comporte que le nom de la société !

BASES CLASSIQUES : L'ENQUETE PIETINE


Afin d’avoir des éléments de comparaison, nous avons voulu savoir ce que proposaient les grands serveurs classiques sur cette entreprise. Nous avons donc interrogé les serveurs Factiva, LexisNexis, Dialog, DataStar, STN, L’Européenne de Données et Europresse. Hélas, les résultats ne sont pas plus probants. Deux informations sont reprises par la plupart des serveurs : l’article de Chemical Market Reporter et la présence de Futian Pharmacy comme exposant dans un salon.

Dialog, avec ses 500 banques de données, nous offre néanmoins quelques éléments supplémentaires :
- la base de Dun&Bradstreet (D&B Dun’s Market Identifiers, fichier n°518) fournit ainsi quelques données financières de 2001 : chiffre d’affaires, bénéfice, résultat net ;
- mais c’est Piers Imports (fichier n°573) qui donne les renseignements les plus “originaux” ; cette base signale en effet les entrées de cargo dans les ports maritimes américains (dix-huit mois d’antériorité). On y apprend qu’entre mai et décembre 2003, six cargo ont transporté des produits de Futian Pharmacy, à destination d’entreprises américaines ; pour chaque mouvement, sont indiqués le produit importé et son code, son conditionnement (type – sacs, cartons...– et nombre), le nom de l’entreprise importatrice et sa localisation, le port d’embarquement et de débarquement et la date d’arrivée du cargo.

L'INVESTIGATION SE POURSUIT SUR LE NET


Les premiers éléments de la recherche laissent à penser qu’il y a peu d’informations en ligne sur cette société, puisque ni Google ni les bases classiques n’ont donné réellement satisfaction...
On a certes appris que Futian Pharmacy participait à des salons, fabriquait et exportait (notamment vers les Etats-Unis) des polyols, mais l’on n’en sait guère plus sur son activité, ses usines, en dehors des quelques renseignements très pertinents fournis par le site brésilien.

Quelles pistes peut-on suivre pour aller plus loin ?
Les serveurs classiques nous ont permis d’interroger une partie non négligeable du Web invisible – Dialog et Lexis Nexis offrent tous deux plus de 4 milliards de documents, soit l’équivalent chacun d’un Google, composé uniquement de documents professionnels et validés ! Il y a bien sûr de nombreuses autres sources, mais les identifier et les interroger une à une risque d’être une tâche longue et fastidieuse !

Google pour sa part a lancé sa requête sur le Web visible. Plus précisément, sur la partie du Web visible qu’il indexe. Or, Google annonce aujourd’hui interroger 4,2 milliards de pages, soit moins de la moitié du Web visible..

Dans un cas comme celui-ci, il est donc impératif d’interroger d’autres moteurs de recherche, qui auront une couverture complémentaire. Pour ce type de question (basique, et donnant peu de réponses), un métamoteur peut également se révéler un outil approprié. Notre choix se porte dans un premier temps sur AlltheWeb, le concurrent direct de Google, qui indexe plus de 3,1 milliards de pages.
 - AlltheWeb : des pistes prometteuses
Une recherche sur AlltheWeb avec les mots “futian pharmacy” identifie six pages. Si cinq d’entre elles ne font que reprendre les informations déjà trouvées sur Google, la sixième est une bonne surprise.
Disponible sur le site Show.agrisd.com, elle décrit en détail une proposition de joint-venture de Futian Pharmacy pour la mise en place d’une nouvelle ligne de production, d’une capacité annuelle de 10 000 tonnes. Une analyse du marché des principaux produits fabriqués est fournie, et les bénéfices économiques espérés sont indiqués.
Dans le bas de la page, un lien permet d’afficher des données complémentaires sur Futian Pharmacy. Et l’on obtient là de nombreux renseignements : les prix qu’elle a remportés en Chine (the Advanced Enterprise of the Food Industry of China...), le nombre d’employés (et le nombre de techniciens et ingénieurs), les capacités de production pour différents produits, etc.

A titre de vérification, nous avons interrogé Google avec la requête site:show.agrisd.com, pour lister les pages de ce site qu’il avait indexées*. Curieusement, 157 pages de ce site sont présentes dans l’index de Google. Mais en fait, à quelques exceptions près, seule l’URL de la page est affiché – sans titre ni extrait –, la page de résultat indiquant par exemple : show.agrisd.com/product/index1.asp?class1=25 Pages similaires.

Le contenu de la page n’est pas (encore ?) indexé et un clic sur l’URL affiche fréquemment un message d’erreur. Peut-être Google a-t-il des difficultés à indexer certaines pages en format asp ?
AlltheWeb, quant à lui, n’a aucun problème pour indexer le contenu des mêmes pages. Pour chacune, il indique le titre, la balise description et l’URL. Et les requêtes portent bien sur le texte intégral des pages.
... mais attention aux préférences
En regardant attentivement la page de résultats d’AlltheWeb, on remarque toutefois que par défaut, la requête sur Futian Pharmacy s’est effectuée sur les pages en anglais et en français.
Or, d’une façon générale – et a fortiori dans notre cas – il est préférable de lancer ses recherches sur l’ensemble des pages Web (ne serait-ce que pour obtenir la page en brésilien identifiée par Google).
Sur AlltheWeb, il suffit de cocher l’option “Any language” sous la zone de saisie (cette préférence peut être enregistrée) et relancer la requête. On obtient alors quinze pages, au lieu des six précédentes. Bizarrement, certaines des nouvelles pages sont pourtant en anglais...

Ainsi, le premier résultat de la requête est une page intitulée Newchems Website (www.newchems.com) ; elle donne accès à un portail B2B – chinois mais en anglais – dans le domaine de la chimie. Ce site offre une fiche descriptive sur Futian Pharmacy, avec des données sur ses capacités de production, les produits fabriqués et surtout ... l’adresse de son site Web (www.xylitol-cn.com), qu’il faudra bien sûr explorer.
Les résultats d’AlltheWeb comprennent également la page issue de Greatfoodsbrasil.com et de nombreuses pages en chinois. Au total, AlltheWeb se montre donc pour cette requête plus performant que Google. Mais surtout, cet exemple illustre bien qu’il est impératif, dès qu’une recherche sur un moteur obtient peu de réponses, d’élargir sa couverture du Web en interrogeant d’autres moteurs.
- KillerInfo, les atouts d’un méta-moteur
Nous sommes ici dans la situation-type où un métamoteur peut s’avérer efficace :
- la requête est très simple (un mot composé) ; elle devrait donc être comprise sans ambiguïté par tous les outils interrogés ;
- le nombre de pages identifiées par les moteurs est faible ; le métamoteur devrait donc être à même de les rapatrier toutes, qui plus est en les dédoublonnant et en les triant, ce qui est un gain de temps appréciable.

Nous avons choisi d’interroger ici KillerInfo (voir Netsources n°39), un métamoteur qui possède des qualités incontestables. A la requête “futian pharmacy”, KillerInfo identifie 26 pages.
En étudiant les résultats, on se rend compte toutefois que la sélection comprend quelques doublons ; ainsi, des pages identiques, indexées par des outils différents, n’ont pas été dédoublonnées par le métamoteur. Au total, sur les 26 pages, seules deux n’ont été identifiées ni par AlltheWeb ni par Google. L’une reprend le résumé de l’article de Chemical Market Reporter (le texte intégral est accessible sur abonnement) ; l’autre en revanche est beaucoup plus intéressante :
14. ¶Ó-·ÃÎÊÓí∏ÇÒ©Òµ.. Óí∏Ǹ£ÌïÒ©Òµ.. URL: http://www.xylitol-cn.com/... Sources: GigaBlast 1

C’est en fait la page d’accueil du site de Futian Pharmacy (que l’on avait déjà identifié), dont le titre est fort peu engageant car ... écrit en chinois. Comme le navigateur ne peut afficher les idéogrammes, ceux-ci sont remplacés par des signes cabalistiques. Et ce n’est qu’en se connectant au site que l’on découvre qu’il propose une version en chinois, mais aussi une autre en anglais.

EXPLORATION D'UN SITE CHINOIS


La page d’accueil du site affiche uniquement le nom de l’entreprise, avec un lien vers les versions en anglais et en chinois. Un clic sur English donne accès à une page de présentation de la société, qui reprend globalement les informations que l’on a pu trouver dans les diverses sources : prix décernés, capacités de production par produits... Les projets de l’entreprise – notamment ceux concernant de nouvelles lignes de production, avec leurs capacités – sont également indiqués.

Une rubrique News donne accès à deux communiqués de presse. Le premier (mai 2003) fait état d’une communication scientifique américaine attestant les bénéfices pour la santé du polyol, fabriqué notamment par Futian Pharmacy. Le second, de mai 2003 également, est du même type. Ces informations sont certes encou-rageantes pour l’avenir de Futian Pharmacy, mais elles sont beaucoup trop générales ; aucune information plus récente n’est disponible sur le site.

La question que l’on peut alors se poser est la suivante : cette version du site de Futian Pharmacy est-elle la traduction en anglais du site en chinois, ou n’en est-elle qu’une version “simplifiée”... Autrement dit, n’y aurait-il pas sur la version en chinois des actualités plus récentes et, si oui, comment en prendre connaissance, si l’on n’a pas de collaborateur lisant couramment le chinois – et disposant d’un ordinateur avec toutes les polices nécessaires pour l’affichage ! –.

ALTAVISTA BABEL FISH : UN OUTIL PRECIEUX


Pour les internautes qui ne disposent ni des polices adéquates ni du lecteur-traducteur, un outil fort sympathique – et qui plus est gratuit – peut s’avérer utile : le service de traduction offert par AltaVista. Ce service est disponible à l’adresse http://babelfish.altavista.com, ou en cliquant sur le lien Traduction proposé sur l’écran d’accueil d’AltaVista**.
Il permet de traduire un bloc de texte (avec un maximum de 150 mots) ou, plus intéressant, le contenu d’une page Web, en choisissant les langues d’origine et de destination depuis un menu déroulant.

On y trouve notamment les options “du chinois vers l’anglais”, mais aussi du coréen, du russe ou du japonais vers l’anglais. Certes, il est important de rappeler qu’il s’agit ici de traduction automatique (technologie Systran) et que les informations fournies sont par conséquent très “approximatives”. Il peut y avoir en effet des contresens, des traduc-tions inappropriées de noms propres, etc. Néanmoins, ces traductions permettent le plus souvent de comprendre le sens général d’un article et de voir s’il justifie une traduction “humaine” ou non...

Dans notre cas, en se connectant à la version en chinois du site de Futian Pharmacy et en cliquant sur l’onglet News – enfin sur le bouton situé au même endroit que l’onglet News de la version en anglais – on s’aperçoit vite que la rubrique offre cinq communiqués (et non deux), le plus récent datant de décembre 2003. Il suffit alors de copier-coller l’URL dans la zone appropriée de BabelFish et de choisir les langues de départ/destination pour obtenir des traductions certes grossières des communiqués, mais qui permettent incontestablement d’en savoir plus sur la société (et notamment qu’elle a investi dans le développement d’un centre de R&D).
Le même principe peut d’ailleurs être appliqué aux nombreuses pages en chinois identifiées par AlltheWeb. L’une en particulier, proposée par le Department of Foreign Trade and Economic Cooperation of Shandong Province, est riche d’informations sur l’usine...

Au total, ces quelques “trucs et astuces” démontrent, s’il en était besoin, que l’utilisation combinée de plusieurs outils de recherche s’avère indispensable, dès lors que le premier n’a pas donné satisfaction...
Cela étant, l’enquête n’est pas close pour autant ! D’autres méthodes de recherche pourraient permettre d’en savoir plus sur la société. L’exploration du Web invisible – et notamment des titres de presse chinoise – pourrait ainsi se révéler fructeuse.... Mais ceci est une autre histoire...

*Depuis fin janvier 2004, l’opérateur site: – suivi d’une URL – peut être utilisé seul sur Google ; il permet de lister l’ensemble des pages indexées par le moteur pour un site donné. Auparavant, il ne pouvait être utilisé qu’en complément d’une requête par mot-clé. Cet opérateur peut également être employé seul sur AlltheWeb.
**On notera que ce service de traduction est offert sur la Toolbar d’AltaVista (voir Netsources n°45).

 

Version imprimable
BASES PUBLICATIONS
27, rue de la Vistule
75013 Paris
Tél. : 01.45.82.75.75
contact@bases-publications.com
Abonnez-vous   |   Contact   |   Mentions légales |   Crédits