
|
Netsources, Numéro de Novembre-Décembre 2004 - n°53 KB-Crawl poursuit son développement |
Auteur : Aurélie Vathonne |
|
Dans le créneau des logiciels permettant une surveillance
automatique de pages ou de sites Web, KB-Crawl commence à se faire
un nom. Au départ moins connu que Website-Watcher ou que les
modules de la gamme Copernic, il présente l’avantage indéniable
d’avoir été développé par la jeune équipe française de Bea
Conseil.
C’est un atout considérable en terme d’accompagnement pour le veilleur, qui peut ainsi bénéficier d’une formation approfondie et d’un service d’assistance efficace et réactif en français. Nous avons déjà eu l’occasion d’évoquer cet outil dans nos colonnes, à l’occasion du compte-rendu de la journée d’études organisée par SCIP France en mai dernier, sur le thème des outils avancés de veille sur Internet (voir Netsources n° 49). Aujourd’hui, Bea Conseil s’apprête à lancer la version 2.5 de ce logiciel, qui offre des améliorations notables en terme techniques, mais aussi de confort d’utilisation. Rappelons que la fonction première de KB-Crawl est d’automatiser la surveillance d’une sélection de sites et de permettre au destinataire de la veille d’être alerté par e-mail de tout changement, ou bien de certains d’entre eux seulement, intervenus sur les pages Web surveillées. Le veilleur est ainsi dispensé de revenir périodiquement et manuellement sur les mêmes sites, pour prendre connaissance des éventuelles nouveautés apparues. Dans la gamme très étendue des outils de veille, il se situe en moyenne gamme, tant par son prix (2 250 € HT pour une licence en version monoposte) que par les fonctionnalités qu’il offre. Nettement plus sophistiqué que des outils simples comme Copernic Tracker, il ne se pose pas non plus en concurrent des plates-formes globales de veille, qui offrent quant à elles de multiples autres fonctionnalités, éventuellement d’autres nature. KB-Crawl se concentre uniquement sur la détection automatique de changements, mais sa conception technique permet de le combiner avec des outils de GED ou de text-mining, ce qui augmente encore son intérêt. L’outil est assez puissant pour surveiller des milliers d’URLs, y compris lorsque celles-ci se trouvent derrière un formulaire ; on peut ainsi surveiller une liste de résultats, issue par exemple de l’interrogation des archives d’un titre de presse. KB-Crawl peut aussi se connecter automatiquement à des sites en accès réservé (gestion des logins et mots de passe), ainsi qu’à des sites en accès sécurisé. Chaque nouvelle version de page est archivée au sein d’une base de données qui, contrairement à ce qui se passe pour d’autres outils, n’est pas limitée en volume. La version 2.5 de KB-Crawl, dont le lancement officiel est prévu dans quelques semaines, constitue une première étape en attendant la v3 en 2006, qui promet d’autres innovations. Pour réaliser ces développements, Bea Conseil bénéficie d’une subvention de l’Anvar (Agence française de l'innovation). Que nous apporte donc ce KB-Crawl nouveau ? Tout d’abord, le logiciel est désormais capable de prendre en compte davantage de formats : les fils RSS, les forums de discussion, mais aussi les documents PDF, Word ou Excel. L’autre changement notable concerne l’alerte déclenchée par l’apparition de mots-clés. Jusqu’alors, l’utilisateur pouvait spécifier qu’il souhaitait être alerté automatiquement lorsqu’un mot précis apparaissait ; il avait donc la possibilité d’entrer dans le système un ou plusieurs mots-clés, mais ceux-ci étaient obligatoirement reliés par un OU. Désormais, l’alerte sur mots-clés peut s’effectuer sur la base d’une requête avancée, qui sera construite à l’aide des classiques opérateurs booléens, de troncatures et même d’opérateurs de proximité. Cette fonctionnalité très “documentaire” est propre à séduire les professionnels de l’information, qui restent d’ailleurs la cible privilégiée de KB-Crawl. En corollaire à ces deux améliorations, l’outil permet désormais d’effectuer des recherches avancées au sein des différentes pages archivées : le mode de recherche sophistiqué utilisé pour surveiller le contenu des pages pourra aussi être utilisé en aval, pour effectuer des recherches a posteriori dans la base de données qui stocke les différentes versions d’une page ou d’un site. Ce mode de recherche avancé peut s’appliquer également aux fichiers PDF, puisque leur contenu textuel est indexé lors de la récupération des fichiers. Toutes les pages archivées dans la base de données peuvent être exportées en dehors de l’application dans leur format initial, ce qui est particulièrement utile aux personnes souhaitant coupler l’utilisation de KB-Crawl à des outils de GED ou de Text-Mining, pour pouvoir exploiter de gros volumes de documents. Les autres nouveautés de la version 2.5 relèvent plutôt du confort d’utilisation de l’outil : import d’URLs à partir d’Internet Explorer (à sélectionner parmi les 50 derniers sites visités), possibilité de ranger dans des dossiers les URLs surveillées par un simple glisser-déposer, possibilité de créer des sous-rubriques (sous-dossiers). Pour les utilisateurs “intensifs” qui surveillent quotidiennement plusieurs milliers d’URLs, un module de gestion du planning de surveillance automatique permet de mieux répartir la charge de connexion au cours de la journée. Enfin, il est désormais possible de continuer à paramétrer la surveillance de nouvelles URLs tout en ayant enclenché des surveillances pour d’autres URLs, ce qui était impossible à faire avant. On regrettera néanmoins que cet outil ne soit pas doté d’une aide contextuelle, ne serait-ce que pour expliquer la syntaxe de l’alerte par mots-clés et de la recherche avancée dans les archives. Il existe certes un assistant, qui permet de construire facilement des requêtes booléennes, mais il n’est pas indiqué par exemple que la troncature est autorisée, ni quel signe doit être utilisé (en l’occurrence l’astérisque “*”). Les aspects liés à l’ergonomie et la convivialité doivent être davantage pris en compte dans la version 3. Un autre pan concernera principalement la publication de l’information, avec un accent qui portera sur la mise en forme du contenu (sous forme du bulletin xml notamment). Pour l’heure, cette version 2.5 conforte KB-Crawl dans sa place unique sur le marché français des logiciels de surveillance automatique du Web : un produit à l’écoute de sa clientèle-cible (les professionnels de l’information), pour un prix beaucoup plus abordable que celui des plates-formes globales de veille. INFORMATIONS : www.kbcrawl.net BEA Conseil 10, rue Lionel Terray 92508 Rueil Malmaison Cedex Tel. 01 41 29 05 05 Fax. 01 41 29 05 06 |
|