Actualités
Agenda
Liens utiles
Netsource
Netsource - Sommaire en cours
Netsource - Anciens sommaires
Netsource - Recherche des archives
Revue Bases
Revue Bases - Sommaire en cours
Revue Bases - Anciens sommaires
Revue Bases - Recherche des archives
Ouvrages
Qui sommes-nous ?
Notre équipe
Accueil > Netsources > "Avatars" de PubMed : comment repérer les tendances scientifiques et médicales ?

Netsources, Numéro de Septembre-Octobre 2008 - n°76


"Avatars" de PubMed : comment repérer les tendances scientifiques et médicales ?

La base de données Medline/PubMed est une référence incontournable pour la littérature internationale biomédicale dans les secteurs de la santé, de la pharmacie et des biotechnologies.(...)

Auteur : Sophie Fréchède-Mathieu Claisse

 
Avec plus de 18 millions de notices bibliographiques, elle représente un volume d’information considérable qui peut être exploité en vue d’identifier les tendances scientifiques et médicales. L’analyse de cette littérature et la mesure de son activité participent à l’anticipation des évolutions scientifiques et médicales, au ciblage des orientations thérapeutiques, à l’identification et au suivi des experts d’un domaine. Cette connaissance représente un enjeu majeur pour rester compétitif et se maintenir dans la course à l’innovation.
  
Depuis quelques années, il existe des “avatars” de PubMed, ou interfaces alternatives à PubMed, qui permettent de répondre à ces attentes. Ces outils sont gratuits, faciles à prendre en main et disponibles en ligne.
   
Les interfaces alternatives à PubMed permettent d’interroger Medline/PubMed par un autre biais. Ce sont des outils qui, non seulement ramènent les mêmes résultats que PubMed lors d’une interrogation, mais aussi comprennent une aide à la recherche (recherche guidée, interrogation en langage naturel, recherche par similarité…) et/ou des services web associés (classement des résultats, analyse statistiques, représentations graphiques et cartographie…). Une étude de la bibliothèque universitaire de médecine de Lausanne les a recensés en 2007(1).
   
A titre d’exemples, on citera parmi les interfaces alternatives à PubMed :
   
- Ali BaBa (http://alibaba.informatik.hu-berlin.de/) ;
- BioMedExperts (http://www.biomedexperts.com) ;
- ClusterMedTM (http:///www.clustermed.info) ;
- eTBLAST (http://invention.swmed.edu/etblast/etblast.shtml) ;
- GoPubMed (http://www.gopubmed.org) ;
- PubFocus (http://www.pubfocus.com) ;
- PubNet (http://pubnet.gersteinlab.org) ;
- PubReMiner (http://bioinfo.amc.uva.nl/ human-genetics/pubreminer)
   
Moins d’une dizaine de ces interfaces offrent, dans leurs services web associés, des fonctionnalités de datamining aux applications concrètes pour identifier les tendances scientifiques et médicales.
   
En quelques clics, il est possible de savoir “qui”, “quoi”, “quand” et “où” sur une thématique donnée et quels sont les journaux de référence, les experts influents et leurs réseaux de collaboration.
   
On peut apprendre, par exemple, que les Etats-Unis et le Japon sont les principaux pays qui publient sur les vaccins dans la maladie d’Alzheimer. Depuis 2002, on dénombre une vingtaine de publications par an sur cette thématique et le journal le plus représenté est Nature Medicine.
   
Trois de ces interfaces sont ici présentées, sélectionnées pour la valeur ajoutée de leurs fonctionnalités et leur complémentarité : GoPubMed, PubFocus et PubReMiner. Le langage d’interrogation présente l’avantage d’être le même que celui utilisé dans PubMed.
   

GOPUBMED : GRAPHIQUE ET "USER FRIENDLY"

   
GoPubMed a été lancé par la spin-off allemande Transinsight GmbH et la Technische Universität Dresden.
   
Son interface, très conviviale, fournit à l’issue d’une interrogation plusieurs possibilités pour obtenir des statistiques sur les résultats.
   
L’utilisateur peut visualiser les statistiques générales (top 20 auteurs, journaux, villes, pays et années) en cliquant sur le lien en tête de page “Show statistics for these articles”. Les statistiques portent sur les 1 000 résultats les plus récents de la requête.
   
Par ailleurs, un menu dynamique, à gauche, affiche des clusters de résultats selon quatre axes : “What”, “Who”, “Where” et “When”. Chaque axe regroupe une mine d’information. Si l’on s’intéresse par exemple aux auteurs, en cliquant sur l’item “Who”, on découvre les vingt les plus représentés dans la requête et leur volumétrie de publication.
   
Une cartographie des réseaux de collaborations d’auteurs est également disponible en cliquant sur l’item “What” puis “Hot topics in GO &MesH”(2). Autre option intéressante : GoPubMed retrace les affiliations successives des auteurs dans l’affichage des résultats de la requête.
   
L’originalité et la force de GoPubMed reposent surtout sur les représentations visuelles des statistiques, efficaces et directement exploitables : histogrammes, courbes temporelles et cartographies.
   
A signaler : une vidéo est accessible depuis la page d’accueil pour guider l’utilisateur dans ses premiers pas sur cette interface. On notera néanmoins que ce didacticiel est proposé en anglais, allemand, japonais et espagnol, mais pas en français.

   

PUBFOCUS : ZOOM SUR L'IMPACT

Développé par la University of Southern California, PubFocus met l’accent sur la qualité de l’activité de recherche et la notoriété des auteurs.
   
Dans ses analyses statistiques il prend en compte les facteurs d’impacts des journaux calculés par l'Institute for Scientific Information (ISI) et les citations(3).
   
Cette analyse très fine, utilisant des algorithmes de calculs complexes, conviendra plutôt à des initiés. Cependant, une aide en ligne explique les différentes formules de calculs utilisées et leur signification.
   
A l’issue d’une requête par la recherche simple ou avancée, PubFocus offre de larges possibilités dans l’affichage et le tri des résultats. En particulier, les items “or”, “not” et “only” permettent d’exclure ou de distinguer certains articles, journaux ou auteurs et de lancer les statistiques uniquement sur sa propre sélection.
   
Les analyses statistiques sont conduites sur les 2 500 résultats les plus récents de la requête. On accède à l’ensemble des statistiques sur les journaux, les citations, les années, les auteurs et les langues de publications, au niveau de l’onglet “Statistics: Top 10”.
   
Le temps de réponse est affiché, variable en fonction du volume du corpus à analyser. PubFocus va plus loin encore que GoPubMed sur les statistiques concernant les auteurs, puisqu’il distingue les premiers auteurs des derniers (“Principal Investigators”) dans son traitement. L’affichage graphique des données est sobre, sous forme d’histogrammes.
   

PUBREMINER : FINESSE DU CLUSTERING

   
PubReMiner a été conçu par Jan Koster, membre du département de recherche en génétique humaine de l’Academic Medical Center (AMC) d’Amsterdam.
   
Dès la page d’accueil, PubReMiner présente quelques applications concrètes  d’utilisation dans les encadrés “Find Experts”, “Research Interest” et “Which Journal ?”.
   
La fenêtre de recherche en mode avancé et la visualisation des résultats est simple et efficace. Une estimation du temps de réponse est annoncée. Le nombre de résultats générés par une requête ne doit pas excéder 1 000 pour pouvoir être traité.

Les résultats de l’analyse statistique s’affichent sous une même page en colonnes de clusters : années, journaux, auteurs, mots cités, MeSH, substances et pays de publication.
   
Chaque terme affiché dans les colonnes peut être sélectionné dans un second temps afin d’affiner la recherche. L’utilisateur a la possibilité de personnaliser les colonnes qu’il veut voir, ou non, déroulées à l’écran. A noter : comme PubFocus, PubReMiner distingue depuis peu les premiers et les derniers auteurs dans son analyse.
   
PubReMiner ne propose aucun traitement graphique mais dispose d’une fonctionnalité de sauvegarde des résultats dans un fichier texte. On émettra quelques regrets sur l’absence de visualisation des notices bibliographiques sur le site. Celles-ci sont toutefois accessibles en cliquant sur la petite lettre “p” en bleu dans les colonnes à coté de chaque résultat, une pop-up renvoyant alors directement sur le site de PubMed.
   

FIABILITE ET DEVELOPPEMENTS EN COURS

   
GoPubMed, PubFocus et PubReMiner apportent une valeur indéniable dans le repérage des tendances scientifiques et médicales, en ayant l’avantage d’être gratuits.  Faut-il, ou non, s’interroger sur la fiabilité des résultats au regard de cette gratuité ?
   
Nous avons testé ces trois interfaces en comparant les résultats obtenus à ceux calculés manuellement depuis PubMed. Aucun d’entre eux n’apporte une fiabilité totale mais ils fournissent tous des résultats très satisfaisants.
   
Nous avons obtenu, en contactant les producteurs de ces interfaces, une explication sur le fonctionnement des algorithmes de calculs sur les champs auteurs et année de publication.
   
Les algorithmes ont différents niveaux de finesse. Concernant le traitement sur le champ auteur, PubReMiner considère chaque écriture comme un auteur distinct (par exemple : CURRAN W et CURRAN WJ). PubFocus, lui, n’effectue pas un simple comptage numérique des auteurs, il leur affecte un poids différent selon leur place dans la signature de la publication (par exemple, les auteurs qui sont au milieu contribuent pour 1/3). De même, le traitement sur le champ année de publication, varie suivant l’outil. GoPubMed et PubFocus considèrent la date de pré-publication en ligne lorsque celle-ci est disponible.
   
Ces trois interfaces sont régulièrement améliorées et pour certaines, des versions payantes sont développées.
   
C’est le cas de GoPubMed qui propose une version “GoPubMed PRO” qui a, par exemple, été déployée pour Unilever.
   
Dans cette déclinaison professionnelle, on trouve notamment les améliorations suivantes : possibilité de créer ou d’importer ses propres ontologies, extension possible de la recherche sémantique à son Intranet d’entreprise.
   
PubFocus, quant à lui, est en cours d’élaboration d’une nouvelle version, accessible par abonnement. Cette dernière utilisera le “h-index” (highly cited index) pour ses statistiques sur les auteurs. Des fonctionnalités de présentation, sauvegarde et export des données en format Excel, sont également prévues.
   
En conclusion, repérer les tendances scientifiques et médicales est aujourd’hui plus facile et plus rapide grâce au développement de nouvelles technologies et des ressources sémantiques. Gageons que ces initiatives auront très prochainement d’autres applications et seront étendues à de nombreuses autres sources.
_________________________________
   
(1) Isabelle de Kaenel, Pablo Iriarte. Medical Library, University Hospital. Lausanne. Alternative interfaces for PubMed searches. EAHIL WORKSHOP, Krakow Poland. 12-15 September 2007.
   
(2) Transinsight Press Release. GoPubMed with Social Networking Features for Biomedical Literature Experts. Dresden, Germany December 2007.
   
(3) Plikus MV, Zhang Z, Chuong CM. PubFocus: semantic MEDLINE/PubMed citations analytics through integration of controlled biomedical dictionaries and ranking algorithm. BMC Bioinformatics. 2006 Oct 2;7:424.
   

LES AUTEURS

   
Sophie Fréchède, Responsable Information Scientifique, PFIZER
Mathieu Claisse, Chargé de projets Information Scientifique et Médicale et Knowledge Management, PFIZER


 

Version imprimable
BASES PUBLICATIONS
27, rue de la Vistule
75013 Paris
Tél. : 01.45.82.75.75
contact@bases-publications.com
Abonnez-vous   |   Contact   |   Mentions légales |   Crédits