
|
Bases, Numéro de juillet-août 2008 - n°251 TotalPatent : la (très) large base brevets de LexisNexisAprès – assez longtemps après, en fait – le rachat d’Univentio par LexisNexis, ce serveur a lancé en fin d’année dernière son service TotalPatent. Nous avons attendu que les premières améliorations soient apportées avant de le tester, sachant que c’est un processus sans fin et que de nombreuses évolutions sont prévues d’ici à la fin de l’année.(...)
|
Auteur : François Libmann |
|
LexisNexis était présent depuis très longtemps dans les brevets
avec LexPat et avait même “subrepticement” chargé les brevets
américains depuis l’origine*. Mais, conséquence du déploiement de
TotalPatent, LexPat en tant que tel sera déchargé à la fin de
l’année.
La création de TotalPatent élargit encore l’offre brevets des grands serveurs ou des services spécialisés et marque la volonté de LexisNexis de se positionner fortement dans cet univers déjà bien encombré. S’y trouvent déjà, en effet, les serveurs Questel, STN et Dialog, MineSoft avec PatBase et Thomson avec Thomson Innovation, sans oublier les sources gratuites fiables telles que les déclinaisons – principalement européenne et française – d’Espacenet, les sites d’offices de brevets tels que l’USPTO pour les brevets américains et d’autres sites moins fiables comme Google Patents (ce dernier interroge les brevets déposés à l’USPTO, mais n’affiche qu’une sélection des résultats. Même si TotalPatent utilise le moteur de LexisNexis et des données sur les entreprises d’autres bases présentes sur le serveur, il s’agit d’un produit à part entière pour lequel il faut signer un contrat spécifique. UNE COUVERTURE INEGALEELa première force de TotalPatent est sa couverture. Celle-ci est en effet plus large que celle d’InpadocDB sur STN et de PlusPat sur Questel (qui est sensiblement équivalente), elles-mêmes plus larges que celle de World Patents Index, de Derwent. Cela étant, les informations fournies pour un brevet donné sont assez différentes d’une base à l’autre. TotalPatent répartit ses sources en trois catégories : - “All major full text authorities”, qui inclut les collections de brevets américains, européens, PCT, japonais, allemands, français et anglais. Le titre de cette catégorie est légèrement trompeur car, pour certains brevets anciens et surtout très anciens, l’information peut être succincte et on est loin de disposer du texte complet. Ce problème d’information limitée pour les brevets vraiment anciens se retrouve partout. Néanmoins, on trouve dans TotalPatent, plus que dans les autres bases, des textes complets pour des brevets très anciens, souvent avec le texte original et une traduction en anglais. En ce qui concerne les brevets japonais, leur texte intégral est en format image et en japonais. Lors de nos tests, le résumé en anglais était particulièrement succinct, puisqu’il ne s’agissait, en fait, que du début du résumé de la référence Japio. On nous a assuré que le reste du résumé de Japio serait chargé très prochainement et que l’objectif était de proposer, pour la fin de l’année, l’ensemble de la référence et la traduction automatique en anglais du texte intégral, qui sera donc recherchable. En fouillant un peu, nous avons été quelque peu surpris de voir, dans le document présentant la liste des pays couverts et leur antériorité, que le plus ancien brevet français délivré datait ... du 25 mars 1837, alors que les demandes remontaient “seulement” au début du 20ème siècle. Vérification faite, la priorité du brevet en question datait du 26 février 1936 – cette date de 1837 est manifestement sortie du chapeau de l’OCR – et le plus ancien brevet délivré date quant à lui du début du siècle, ce qui est plus logique ; son texte intégral est d’ailleurs disponible. S’il est bien connu que les documents anciens “océrisés” comportent un nombre non négligeable d’erreurs, ce nombre devrait diminuer car LexisNexis prévoit de les “ré-océriser” avec une technologie plus performante ; - la deuxième catégorie, incluant également les brevets en texte intégral, correspond aux brevets des offices de seize autres pays : ex-Allemagne de l’Est, Australie, Autriche, Belgique, Canada, Danemark, Espagne, Finlande, Irlande, Italie, Luxembourg, Monaco, Pays-Bas, Portugal, Suède et Suisse. Là encore, tout n’est pas chargé. C’est le cas par exemple du Danemark, mais LexisNexis, outre son propre planning de chargement, est aussi dépendant des sources disponibles et ... de la bonne volonté des détenteurs de ces sources ; - quant à la troisième catégorie, elle est limitée aux informations bibliographiques ; elle couvre les offices de 74 pays très divers et parfois exotiques qu’on ne trouve pas, pour certains, dans les autres services, tels que le Chili ou la Colombie. TotalPatent, en effet, ne s’est pas limité à DOCDB de l’OEB, mais a également pris en compte des brevets issus d’autres offices nationaux. D’après le User Manual mis à jour le 21 juin 2008, la traduction automatique en anglais est disponible pour les brevets publiés depuis le 1er octobre 2007 pour les pays suivants : Allemagne Autriche, ex-Allemagne de l’Est, Belgique, Canada , brevets européens et PCT, Espagne, France, Italie, Luxembourg, Monaco, Pays-Bas, Portugal, Suède et Suisse. Mais en réalité, cette traduction automatique est infiniment plus avancée et déjà achevée pour la France ; elle est sur le point d’être achevée pour les autres pays ce qui, même s’il y a quelques lacunes, représente un ensemble impressionnant. Pour les offices dans lesquels les brevets déposés peuvent être en plusieurs langues, tels que l’OEB, cela ne s’applique évidemment qu’aux brevets qui ne sont pas en anglais. Par ailleurs, LexisNexis examine la possibilité d’offrir aussi les brevets chinois et coréens en texte intégral – avec traduction automatique en anglais –, ainsi que, éventuellement, les brevets polonais, car leur outil de traduction automatique traite cette langue. DEUX OPTIONS DE RECHERCHE ASSEZ PROCHESDeux options de recherche sont proposées, une “guided search” et une “advanced search”, qui ne sont pas fondamentalement différentes. On trouve en effet dans les deux cas une zone de saisie assez grande, pour entrer ses termes de recherche. Un menu déroulant au-dessus de la zone permet de limiter la requête aux champs titre/résumé/revendications, titre/résumé, titre ou revendications. Par défaut, il n’y a pas de limitation. Sous cette zone, un lien propose d’avoir la liste des connecteurs disponibles, ce qui est fort utile pour ceux qui découvrent le produit ou ne connaissent pas LexisNexis par ailleurs. En fait, le moteur de recherche et ses possibilités ne sont pas cachés bien loin derrière l’interface... L’utilisation des connecteurs et des autres possibilités permet de construire des stratégies autrement plus sophistiquées que dans Espacenet, même si elles doivent être entrées en une seule fois. Néanmoins, cette impossibilité de combiner les étapes de recherche avec LexisNexis limite nécessairement la complexité possible des requêtes, en comparaison de ce que l’on peut faire sur Questel, Dialog ou STN. TotalPatent propose les classiques opérateurs booléens et de proximité, l’opérateur atleast pour exiger la présence n fois d’un terme, ainsi que la limitation éventuelle au singulier ou au pluriel (le pluriel est automatique par défaut) et la gestion des majuscules, qui sont des particularités intéressantes de LexisNexis. La recherche simple est effectuée sur tous les brevets sélectionnés dans les préférences. Le détail est visualisable via le bouton “show more options” et l’on peut alors affiner la sélection des pays. Dès que l’on fait une nouvelle recherche, la sélection des pays revient à celle des préférences. On peut se demander s’il ne serait pas plus judicieux que la sélection de pays soit réinitialisée uniquement au moment de la connexion. D’autres zones de saisie permettent d’entrer respectivement le nom des déposants et celui des inventeurs, des codes IPC (de l’ensemble des classifications réunies), des codes de la classification américaine et, en option, un code ECLA ou un pays de publication. On peut aussi limiter par date de publication. Tout cela permet d’éviter d’entrer des préfixes – nombreux par ailleurs, comme on peut le voir dans le manuel – pour ces différents champs. Dans l’écran de recherche avancée, on trouve la même zone de saisie et, sous la possibilité de limiter par date de publication, on dispose de “boîtes de restrictions”, dont on peut faire varier le nombre, permettant de sélectionner dans chaque boîte un champ et un ou des termes à l’intérieur. Pour les deux types de recherche, on trouve dans la partie droite de l’écran une série de boîtes correspondant à une série de recherches spécifiques. La première est une recherche par numéro de publication, avec la possibilité d’obtenir le texte intégral, la famille ou le PDF. Les formats des numéros de brevet étant une matière particulièrement variable, il n’est pas inutile de cliquer sur View Format, sachant néanmoins que le format américain est privilégié sur celui utilisé par l’OMPI, compte tenu de la clientèle prioritaire – qui est américaine – de TotalPatent. La deuxième est “Look up Assignee or Inventor” et permet de chercher le déposant ou les inventeurs, à partir d’un nom ou d’une partie de nom. Après avoir cliqué sur Find, TotalPatent affiche respectivement, sous la zone de saisie, la liste des noms d’inventeurs ou de déposants contenant le mot saisi, avec une case permettant de sélectionner les noms de son choix. Un clic sur Add affiche les noms dans la boîte de recherche, reliés par OR, et précédés du préfixe assignee ou inventor. La recherche est ensuite lancée sur les collections sélectionnées, après que l’on ait, éventuellement, ajouté d’autres termes de recherche. Il nous est arrivé qu’un nom de déposant comporte le mot AND et que, du coup, le résultat soit nul, le mot ayant été interprété comme un opérateur. Le problème a été identifié et sera résolu en principe en juillet, par la mise entre guillemets de chaque nom. Encore en dessous, se trouve la possibilité de rechercher les filiales des sociétés. Là encore, on entre un nom et le système affiche une série de résultats. Cette fois, le système recherche non pas dans TotalPatent, mais dans les banques de données d’annuaires d’entreprises disponibles sur le serveur. Certains noms sont cliquables parce qu’ils sont dans une hiérarchie, mais cela ne veut pas dire pour autant qu’ils apparaissent comme déposant sous ce strict nom. D’autres noms apparaissent sans être cliquables et donnent une bonne idée des différents noms de l’entreprise et de celles qui lui sont liées. Compte tenu de l’hétérogénéité des sources, cette recherche ne peut être considérée comme totalement fiable ; elle donne néanmoins des indications intéressantes. Dans le bas de l’écran, on trouve des liens vers : - la classification internationale des brevets, sur le site de l’OEB ; - la classification américaine sur le site de l’USPTO ; - la classification ECLA sur le site de l’OEB ; - différentes aides à la recherche, dès lors qu’elle n’est plus élémentaire. Une fois la recherche lancée, le système peut afficher un message dans deux cas : - s’il n’y a aucun résultat, il propose de modifier la requête ; - si au contraire il y a plus de 3 000 réponses, le système le signale et – c’est heureux – il ne bloque pas la recherche comme sur d’autres interfaces de LexisNexis. Il propose en effet de visualiser les 3 000 premiers résultats, ce qui est plus que largement suffisant pour se faire une idée de leur pertinence et en tirer les conséquences. Il propose aussi d’en mettre 20 000 dans un dossier pour un traitement ultérieur, et offre enfin de modifier la requête. Le format de visualisation est paramétrable dans les Préférences. Un format classique est le défilement des données bibliographiques avec un résumé dans la langue du brevet et, le cas échéant, une image sur la partie droite. Si l’on clique sur l’onglet Show Term Hits, apparaissent en plus les mots de recherche surlignés (une couleur par mot) trouvés dans l’ensemble du brevet – ce qui inclut les revendications et les descriptions – entourés de quelques mots, mais on ne peut les imprimer tels quels. On peut aussi cliquer sur Family pour voir la famille, avec l’option de limiter à la famille stricte (les brevets qui ont exactement les mêmes priorités) ou la famille étendue (les brevets qui ont au moins une priorité en commun). On peut enfin, après avoir sélectionné une série de brevets, faire apparaître une carte des citations. Le bouton “Purchase” permet de commander des “Files Histories” (comme sur Dialog, voir Bases n°246, février 2008) ou une traduction “humaine” d’un brevet. On peut choisir d’imprimer les documents de son choix dans le format de son choix, y compris le format KWIC (KeyWords In Context), ou de les visualiser en PDF quand ce format est disponible, ce qui est fréquent. On peut aussi choisir de visualiser les documents un par un avec une série d’options : full, claims, image, kwic, family, legal... Pour certains offices tels que l’OMPI ou l’office allemand, les références citées apparaissent dans les données bibliographiques avec, le cas échéant, un lien pour les brevets cités et citants. On notera que lorsque plusieurs langues sont présentes à l’écran pour un même brevet, il est malheureusement impossible d’imprimer les éléments en plusieurs langues ; il faut en choisir une. l faut signaler aussi la présence de nombreuses informations légales issues, en particulier, d’Inpadoc. Il existe par ailleurs, pour les experts, un très grand nombre de champs afin de limiter sa recherche, par exemple “citation-origin” – qui permet de limiter la recherche aux citations de l’examinateur ou à celles du déposant – ou “CERT-CORR issued”, pour chercher les certificats de correction des brevets US. Signalons aussi que LexisNexis va développer à relativement court terme des liens entre TotalPatent et d’autres produits qu’il propose, comme LexisNexis Dashboard (issu du rachat de Datops) pour les analyses ou Lexis.com pour la jurisprudence brevet américaine. UN PRODUIT ENCORE EN DEVENIR |
|