Netsources, Numéro de Janvier-Février 2005 - n°54


Fichiers vidéo : la nouvelle quête des moteurs de recherche

Il fut un temps où avoir le plus grand nombre de pages Web indexées semblait être le défi ultime des moteurs de recherche. Dans le peloton de tête des outils, figuraient le plus souvent Google et AlltheWeb, chacun prenant régulièrement la tête du classement, avant d’être dépassé par son rival...

Auteur : Béatrice Foenix-Riou

Mais en rachetant Overture, qui avait lui-même racheté AlltheWeb quelques mois plus tôt, Yahoo! a mis fin à la course entre les deux géants (AlltheWeb et Google) et la situation s’est stabilisée...

Hormis le temps d’une brève apparition de MSN en tête du peloton – lors du lancement, le 11 novembre, de son nouveau moteur indexant 5 milliards de pages, voir Netsources n°53 –, le titre envié de moteur le plus important du Web est détenu par Google, avec 8 milliards de pages.

Il ne faudrait pas pour autant penser que Google, moteur chéri des internautes, occupe la place de leader pour tout ce qui concerne la recherche sur le Net.
La diversification est en effet à l’ordre du jour et les moteurs se déploient vers de nouveaux horizons.

Géolocalisation, personnalisation et, plus récemment, lancement d’outils de type “desktop search” – ces logiciels qui permettent de lancer une requête sur le Web mais aussi, et surtout, sur l’ordinateur de l’utilisateur  (voir Netsources n°53) –, les idées fleurissent et la concurrence bat son plein...

Sur un autre plan, les fichiers multimédia inspirent également les moteurs et pourraient devenir leur nouveau graal...

Le développement des connexions Internet à haut débit a en effet permis la multiplication – et l’utilisation – des fichiers multimédia sur le Net.

D’après l’ART (Autorité de régulation des télécommunications), 75 % des netsurfers parisiens utilisent le haut débit et plus de huit millions d’internautes en France (31 %) téléchargent des fichiers vidéo et de la musique !

Il était donc logique que les trois géants de la recherche sur Internet – Google, Yahoo! et MSN – s’intéressent de près à ce nouveau média et tentent d’ajouter à leurs cordes la recherche de fichiers vidéo.

YAHOO! REPERE LES FICHIERS VIDEO SUR LE WEB

(http://video.search.yahoo.com)

Prenant ses rivaux de vitesse, Yahoo! a “dégainé le premier” en lançant en décembre la version bêta d’un module de recherche sur les fichiers vidéo, accessible depuis http://video.search.yahoo.com (voir Netsources n°53).

Comme c’était prévisible il a, depuis, ajouté un onglet spécifique Video – au dessus de la zone de saisie – sur son portail Yahoo.com (uniquement depuis la version américaine pour le moment, mais c’est l’une des pages les plus vues du Web), ainsi que sur l’interface Yahoo! Search Technology (search.yahoo.com)...

Pour permettre une recherche par mots, Yahoo! indexe le texte situé à proximité du lien (vers le fichier) dans la page Web, ainsi que les balises du fichier vidéo (titre...).

La page de résultats affiche les vidéos sous forme de vignettes – ce qui permet de savoir immédiatement si le document est pertinent ou non –, et donne pour chacune le titre, la durée, la taille et l’URL.

En cliquant sur la vignette, on obtient une page divisée en deux : dans le haut de l’écran, se trouvent quelques données supplémentaires sur le fichier, ainsi qu’un lien Play Video, permettant de visualiser la vidéo (il faut toutefois disposer du logiciel ou du plug-in adéquat). Dans la partie centrale, on dispose du fichier dans son contexte, c’est-à-dire d’une copie de la page Web qui offre la vidéo.

Le service de Yahoo! ne révolutionne donc pas la recherche de documents multimédia, puisqu’il est de même type que la recherche d’images chez Google.

Yahoo! “se contente” de repérer, dans son index de pages Web, celles qui contiennent des fichiers vidéo et propose à l’internaute de lancer des recherches sur les mots qui entourent le fichier et sur ses balises.
Plus original, il suggère aux utilisateurs d’enrichir son index en lui envoyant des vidéos via le module Media RSS.

Mais fin janvier, l’un des dirigeants de Yahoo! a précisé que le service ne comptait pas s’arrêter là. Dans quelques semaines, il devrait également permettre de lancer des recherches sur les émissions fournies par Bloomberg, la BBC et le British Sky Broadcasting Group, et ce grâce à un partenariat avec TVEyes, qui fournira la technologie pour capturer et indexer le contenu des émissions radio et TV.

C’est ce type de service que propose justement Google Video, lancé par Google le 25 janvier dans ses laboratoires (http://labs.google.com) et directement depuis l’adresse http://video. google.com.

GOOGLE VIDEO INDEXE LES PROGRAMMES TV

(http://video.google.com)

Pour le lancement en version bêta du module Google Video, le moteur a  entrepris d’indexer les programmes TV récents de certaines chaînes américaines.
Il procède en fait à une retranscription automatique de l’intégralité des fichiers audio, grâce au télétexte et à un système de reconnaissance vocale ; il permet ensuite de lancer une recherche par mots sur le texte intégral de ces retranscriptions.

Il est possible d’affiner la requête avec des opérateurs comme title: (ex.: title:jeopardy) – on notera que bizarrement, Google Video utilise l’opérateur title:, quand Google Web fonctionne ave intitle: et allintitle... – ou encore channel: (ex.: channel:abc), pour restreindre la requête aux émissions d’une chaîne. Les deux opérateurs peuvent être combinés (ex.: channel:fox title:bush).

Dans sa version bêta, l’antériorité des programmes remonte au maximum à décembre 2004 et huit chaînes seulement sont concernées : les stations de la région de San Francisco de ABC (KGO), KRON, KQED et NBC (KNTV), ainsi que PBS, Fox News, C-SPAN et C-SPAN2.
Mais l’objectif est d’étendre la couverture à d’autres chaînes...

La page de résultats affiche, dans la partie centrale de l’écran, les extraits des émissions pertinentes, avec leur titre, la chaîne, la date et l’heure de passage et la durée et, sur la gauche, une image de l’émission correspondant à l’extrait.
En cliquant sur le titre de l’émission, on obtient les dates de rediffusion éventuelles, ainsi que d’autres images et extraits de l’émission (jusqu’à 5). Mais, contrairement à Yahoo!, il est ici impossible de télécharger ou de visualiser les vidéos identifiées.
Aucune indication n’est donnée sur l’algorithme de classement utilisé. Il est impossible, pour le moment du moins, de trier les résultats par chaîne, par ordre ante-chronologique ou par durée... Dommage !

Dans le communiqué de presse annonçant le lancement de ce service, Larry Page – le co-fondateur de Google – n’hésite pas à déclarer que “ce que Google a fait pour le Web, Google Video entend le faire pour la télévision”... Rien de moins !
Pourtant, les quelques tests effectués sur le service laissent un sentiment de frustration, devant la couverture – huit chaînes américaines – et surtout devant l’impossibilité de visionner les vidéos ; c’est pourtant ce que l’on aurait pu attendre d’un Google Video. Le moteur annonce heureusement que la couverture est amenée à s’enrichir et que le playback est à l’étude...

C’est une bonne nouvelle car en l’état, Google Video s’apparente à un service de  recherche de programmes sur des TV locales... Sans doute son lancement a-t-il été un peu prématuré... En fait, il semble correspondre plus à une riposte précipitée face au lancement de Yahoo! Video qu’à la mise à disposition d’un produit en version bêta certes, mais néanmoins bien finalisé, à l’instar des autres produits Google...

MSN VIDEO / LE TELECHARGEMENT GRATUIT DE FICHIERS VIDEO

(http://video.msn.com)

Autre outil, autre politique...

MSN a annoncé en janvier, lors du salon CES (Consumer Electronics Show) de Las Vegas, le lancement du service MSN Video Download.

L’objectif de ce service est de permettre la récupération de différents clips vidéo (clips musicaux, bandes annonces, actualités...), afin de les transférer sur des baladeurs vidéos basés sur Portable Media Center (PMC, la plate-forme de Microsoft), ainsi que sur certains assistants personnels.
Les clips sont issus de chaînes américaines comme FoxSport, MSNBC, The Today Show, Dateline NBC, Food Network ou encore IFilm et comprennent aussi bien des clips musicaux que des bandes annonces, des programmes pour enfants, des actualités...

Comme l’on pouvait s’y attendre, les vidéos téléchargées seront accompagnées de publicités... Aucune version européenne n’est envisagée actuellement.

Si le lancement de ce service peut intéresser les amateurs de clips, on regrettera que Microsoft fasse preuve d’ostracisme en réservant son service aux postes équipés du système d’exploitation Windows (98, 2000, XP...), du navigateur Internet Explorer et du logiciel Windows Media Player !

BLINKX.TV : UN SERVICE DISCRET MAIS PROMETTEUR

(www.blinkx.tv)

Si les trois géants de la recherche ont largement communiqué sur leurs services vidéo, d’autres outils ont fait leur apparition presque simultanément, de façon beaucoup plus discrète.

Lancé en décembre dernier, Blinkx.tv est ainsi un service très proche de Google Video, mais bien plus mature.
Ce service capture et indexe les flux vidéo publiés sur les sites Web d’émissions radiophoniques et télévisuelles et permet de lancer des recherches par mots sur leurs retranscriptions. Parmi les chaînes indexées, on citera BBC News, Bloomberg, CNN, Sky, ABC, CBS.com, Fox News mais aussi des chaînes comme History, Geography, Biography...

Là encore, la retranscription se fait de façon automatique, en utilisant une technologie de reconnaissance vocale.

Plus innovant, Blinkx utilise sa propre “context clustering technology”, qui permet d’effectuer des recherches conceptuelles. ll est alors recommandé d’utiliser plusieurs mots dans la requête...

Si le principe est très proche de Google Video, la différence fondamentale est que Blinkx.tv permet de visualiser et d’écouter les émissions en ligne. Mais pour des raisons de propriété intellectuelle, les vidéos sont, pour certaines chaînes, limitées à 30 secondes.

D’autre part, Blinkx.tv permet de créer des “Dossiers Video”, qui peuvent être stockés à l’endroit choisi par l’utilisateur (Bureau, Mes Documents...) et qui peuvent contenir par exemple les résultats d’une recherche ; ces dossiers seront automatiquement mis à jour par Blinkx (sans qu’il soit nécessaire de se connecter au site) et les nouvelles vidéos pertinentes viendront s’ajouter au fichier...

Enfin, cerise sur le gâteau, Blinkx.tv supporte les requêtes booléennes et propose un tri des résultats par pertinence ou par date ! On attend avec impatience une couverture de la France...