Je viens de tomber sur un billet intriguant de Gunar Penikis.
On apprend qu’avec les possibilités du speech to text de la dernière suite premium d’Adobe, il est désormais possible de convertir l’audio d’une vidéo en texte. Pendant l’export flv ou f4v, le texte peut dès lors être injecté sous forme de metadata dans le fichier final.
Grâce à la librairie XMP publiée sur le labs, vous pouvez maintenant récupérer et traiter ces données au runtime dans une application Flex ou Air.
Gunar présente dans son article quelques usages intéressants de ces données: Sous-titrage, navigation dans la vidéo par recherche de mots clés, capture GPS qui indique l’endroit du tournage…
L’écrit est (et restera encore longtemps ?) beaucoup plus adapté que la vidéo pour diffuser du contenu sur le web, même si bien sûr il serait aberrant de mettre ces deux médias en compétition frontale. Dans cette affirmation, je fais bien sûr référence à l’accessibilité, l’aspect SEO, les connexions par hyperliens, l’internationalisation des contenus via la traduction automatique en ligne, l’arrivée d’un vrai web sémantique… En résumé tout ce qui fait la richesse et la puissance du contenu écrit sur Internet.
Mais depuis l’initiative Google GAudi et l’arrivée maintenant du XMP dans nos navigateurs, on peut se demander si un premier pas ne vient pas déjà d’être franchi vers une meilleure intégration de la vidéo sur le web en l’inoculant d’un pouvoir sémantique.
Je vous propose pour finir d’aller faire un tour ce billet d’Hubert Guillaud qui propose une réflexion captivante sur l’expansion de la vidéo sur le web. Je trouve sa conclusion plutôt pertinente: « Si YouTube est l’après Google, nous allons pouvoir remiser nos claviers. Mais nous risquons d’y perdre quelque chose. Cette impression de devenir toujours plus consommateur qu’acteur des contenus que l’on visionne, non pas parce que nous serions moins capables de produire des vidéos que des textes à l’avenir (nous nous adapterons), mais parce que le visionnage semble toujours plus passif qu’un temps de lecture. Alors que notre regard est maître de ce qu’on lit sur une page, nous ne sommes pas encore maîtres de la linéarité de la vidéo. Peut-être est-ce là un champ de recherche à pousser plus avant ? »
Via gunar
Super article !
Merci Francis
Posted by jeanphilippe | 23 janvier 2009, 8 h 58 minJ’avais vu la démo du speech to text à l’adobe max à milan, et c’est très très bon, (du moins en anglais), et surtout les sous titres intégrés dans une base de données ensuite sur un site internet, cela permet une vraie recherche efficace dans la vidéo… c’est du très très bon tout ca
Posted by galdric | 23 janvier 2009, 11 h 55 minoui d’ailleurs on peut sur Flash CS4 directement injecter du XMP en passant par les Paramètres de Publication > Flash > Include XMP metadata > File info
Posted by jeanphilippe | 24 janvier 2009, 10 h 10 min