Avec plus de 18 millions de notices bibliographiques, elle
représente un volume d’information considérable qui peut être
exploité en vue d’identifier les tendances scientifiques et
médicales. L’analyse de cette littérature et la mesure de son
activité participent à l’anticipation des évolutions scientifiques
et médicales, au ciblage des orientations thérapeutiques, à
l’identification et au suivi des experts d’un domaine. Cette
connaissance représente un enjeu majeur pour rester compétitif et
se maintenir dans la course à l’innovation.
Depuis quelques années, il existe des “avatars” de PubMed, ou
interfaces alternatives à PubMed, qui permettent de répondre à ces
attentes. Ces outils sont gratuits, faciles à prendre en main et
disponibles en ligne.
Les interfaces alternatives à PubMed permettent d’interroger
Medline/PubMed par un autre biais. Ce sont des outils qui, non
seulement ramènent les mêmes résultats que PubMed lors d’une
interrogation, mais aussi comprennent une aide à la recherche
(recherche guidée, interrogation en langage naturel, recherche par
similarité…) et/ou des services web associés (classement des
résultats, analyse statistiques, représentations graphiques et
cartographie…). Une étude de la bibliothèque universitaire de
médecine de Lausanne les a recensés en 2007(1).
A titre d’exemples, on citera parmi les interfaces alternatives à
PubMed :
- Ali BaBa (
http://alibaba.informatik.hu-berlin.de/)
;
- BioMedExperts (
http://www.biomedexperts.com)
;
- ClusterMedTM (
http:///www.clustermed.info)
;
- eTBLAST (
http://invention.swmed.edu/etblast/etblast.shtml)
;
- GoPubMed (
http://www.gopubmed.org) ;
- PubFocus (
http://www.pubfocus.com) ;
- PubNet (
http://pubnet.gersteinlab.org)
;
- PubReMiner (
http://bioinfo.amc.uva.nl/
human-genetics/pubreminer)
Moins d’une dizaine de ces interfaces offrent, dans leurs services
web associés, des fonctionnalités de datamining aux applications
concrètes pour identifier les tendances scientifiques et médicales.
En quelques clics, il est possible de savoir “qui”, “quoi”, “quand”
et “où” sur une thématique donnée et quels sont les journaux de
référence, les experts influents et leurs réseaux de
collaboration.
On peut apprendre, par exemple, que les Etats-Unis et le Japon sont
les principaux pays qui publient sur les vaccins dans la maladie
d’Alzheimer. Depuis 2002, on dénombre une vingtaine de publications
par an sur cette thématique et le journal le plus représenté est
Nature Medicine.
Trois de ces interfaces sont ici présentées, sélectionnées pour la
valeur ajoutée de leurs fonctionnalités et leur complémentarité :
GoPubMed, PubFocus et PubReMiner. Le langage d’interrogation
présente l’avantage d’être le même que celui utilisé dans
PubMed.
GOPUBMED : GRAPHIQUE ET "USER FRIENDLY"
GoPubMed a été lancé par la spin-off allemande Transinsight GmbH et
la
Technische Universität
Dresden.
Son interface, très conviviale, fournit à l’issue d’une
interrogation plusieurs possibilités pour obtenir des statistiques
sur les résultats.
L’utilisateur peut visualiser les statistiques générales (top 20
auteurs, journaux, villes, pays et années) en cliquant sur le lien
en tête de page “
Show statistics
for these articles”. Les statistiques portent sur les 1 000
résultats les plus récents de la requête.
Par ailleurs, un menu dynamique, à gauche, affiche des clusters de
résultats selon quatre axes : “
What”, “Who”, “Where” et “
When”. Chaque axe regroupe une
mine d’information. Si l’on s’intéresse par exemple aux auteurs, en
cliquant sur l’item “
Who”,
on découvre les vingt les plus représentés dans la requête et leur
volumétrie de publication.
Une cartographie des réseaux de collaborations d’auteurs est
également disponible en cliquant sur l’item “
What” puis “
Hot topics in GO &MesH”(2).
Autre option intéressante : GoPubMed retrace les affiliations
successives des auteurs dans l’affichage des résultats de la
requête.
L’originalité et la force de GoPubMed reposent surtout sur les
représentations visuelles des statistiques, efficaces et
directement exploitables : histogrammes, courbes temporelles et
cartographies.
A signaler : une vidéo est accessible depuis la page d’accueil pour
guider l’utilisateur dans ses premiers pas sur cette interface. On
notera néanmoins que ce didacticiel est proposé en anglais,
allemand, japonais et espagnol, mais pas en français.
PUBFOCUS : ZOOM SUR L'IMPACT
Développé par la University of Southern California, PubFocus met
l’accent sur la qualité de l’activité de recherche et la notoriété
des auteurs.
Dans ses analyses statistiques il prend en compte les facteurs
d’impacts des journaux calculés par l'Institute for Scientific
Information (ISI) et les citations(3).
Cette analyse très fine, utilisant des algorithmes de calculs
complexes, conviendra plutôt à des initiés. Cependant, une aide en
ligne explique les différentes formules de calculs utilisées et
leur signification.
A l’issue d’une requête par la recherche simple ou avancée,
PubFocus offre de larges possibilités dans l’affichage et le tri
des résultats. En particulier, les items “
or”, “
not” et “
only” permettent d’exclure ou de
distinguer certains articles, journaux ou auteurs et de lancer les
statistiques uniquement sur sa propre sélection.
Les analyses statistiques sont conduites sur les 2 500 résultats
les plus récents de la requête. On accède à l’ensemble des
statistiques sur les journaux, les citations, les années, les
auteurs et les langues de publications, au niveau de l’onglet
“
Statistics: Top 10”.
Le temps de réponse est affiché, variable en fonction du volume du
corpus à analyser. PubFocus va plus loin encore que GoPubMed sur
les statistiques concernant les auteurs, puisqu’il distingue les
premiers auteurs des derniers (“
Principal Investigators”) dans
son traitement. L’affichage graphique des données est sobre, sous
forme d’histogrammes.
PUBREMINER : FINESSE DU CLUSTERING
PubReMiner a été conçu par Jan Koster, membre du département de
recherche en génétique humaine de l’A
cademic Medical Center (AMC)
d’Amsterdam.
Dès la page d’accueil, PubReMiner présente quelques applications
concrètes d’utilisation dans les encadrés “Find Experts”,
“
Research Interest” et
“
Which Journal ?”.
La fenêtre de recherche en mode avancé et la visualisation des
résultats est simple et efficace. Une estimation du temps de
réponse est annoncée. Le nombre de résultats générés par une
requête ne doit pas excéder 1 000 pour pouvoir être traité.
Les résultats de l’analyse statistique s’affichent sous une même
page en colonnes de clusters : années, journaux, auteurs, mots
cités, MeSH, substances et pays de publication.
Chaque terme affiché dans les colonnes peut être sélectionné dans
un second temps afin d’affiner la recherche. L’utilisateur a la
possibilité de personnaliser les colonnes qu’il veut voir, ou non,
déroulées à l’écran. A noter : comme PubFocus, PubReMiner distingue
depuis peu les premiers et les derniers auteurs dans son analyse.
PubReMiner ne propose aucun traitement graphique mais dispose d’une
fonctionnalité de sauvegarde des résultats dans un fichier texte.
On émettra quelques regrets sur l’absence de visualisation des
notices bibliographiques sur le site. Celles-ci sont toutefois
accessibles en cliquant sur la petite lettre “
p” en bleu dans les colonnes à
coté de chaque résultat, une pop-up renvoyant alors directement sur
le site de PubMed.
FIABILITE ET DEVELOPPEMENTS EN COURS
GoPubMed, PubFocus et PubReMiner apportent une valeur indéniable
dans le repérage des tendances scientifiques et médicales, en ayant
l’avantage d’être gratuits. Faut-il, ou non, s’interroger sur
la fiabilité des résultats au regard de cette gratuité ?
Nous avons testé ces trois interfaces en comparant les résultats
obtenus à ceux calculés manuellement depuis PubMed. Aucun d’entre
eux n’apporte une fiabilité totale mais ils fournissent tous des
résultats très satisfaisants.
Nous avons obtenu, en contactant les producteurs de ces interfaces,
une explication sur le fonctionnement des algorithmes de calculs
sur les champs auteurs et année de publication.
Les algorithmes ont différents niveaux de finesse. Concernant le
traitement sur le champ auteur, PubReMiner considère chaque
écriture comme un auteur distinct (par exemple : CURRAN W et CURRAN
WJ). PubFocus, lui, n’effectue pas un simple comptage numérique des
auteurs, il leur affecte un poids différent selon leur place dans
la signature de la publication (par exemple, les auteurs qui sont
au milieu contribuent pour 1/3). De même, le traitement sur le
champ année de publication, varie suivant l’outil. GoPubMed et
PubFocus considèrent la date de pré-publication en ligne lorsque
celle-ci est disponible.
Ces trois interfaces sont régulièrement améliorées et pour
certaines, des versions payantes sont développées.
C’est le cas de GoPubMed qui propose une version “GoPubMed PRO” qui
a, par exemple, été déployée pour Unilever.
Dans cette déclinaison professionnelle, on trouve notamment les
améliorations suivantes : possibilité de créer ou d’importer ses
propres ontologies, extension possible de la recherche sémantique à
son Intranet d’entreprise.
PubFocus, quant à lui, est en cours d’élaboration d’une nouvelle
version, accessible par abonnement. Cette dernière utilisera le
“h-index” (
highly cited
index) pour ses statistiques sur les auteurs. Des
fonctionnalités de présentation, sauvegarde et export des données
en format Excel, sont également prévues.
En conclusion, repérer les tendances scientifiques et médicales est
aujourd’hui plus facile et plus rapide grâce au développement de
nouvelles technologies et des ressources sémantiques. Gageons que
ces initiatives auront très prochainement d’autres applications et
seront étendues à de nombreuses autres sources.
_________________________________
(1) Isabelle de Kaenel, Pablo
Iriarte. Medical Library, University Hospital. Lausanne.
Alternative interfaces for PubMed searches. EAHIL WORKSHOP, Krakow
Poland. 12-15 September 2007.
(2) Transinsight Press Release.
GoPubMed with Social Networking Features for Biomedical Literature
Experts. Dresden, Germany December 2007.
(3) Plikus MV, Zhang Z, Chuong
CM. PubFocus: semantic MEDLINE/PubMed citations analytics through
integration of controlled biomedical dictionaries and ranking
algorithm. BMC Bioinformatics. 2006 Oct 2;7:424.
LES AUTEURS
Sophie Fréchède,
Responsable Information Scientifique, PFIZER
Mathieu Claisse, Chargé de
projets Information Scientifique et Médicale et Knowledge
Management, PFIZER