
© Geoffroy Peeters. équipe analyse/synthèse, Ircam-CNRS
Calcul automatique de résumé sonore de morceau de musique par analyse du signal audionumérique.
Face à la profusion de musique disponible sur le web, les amateurs et les professionnels de l'audiovisuel se sentent perdus. Pour classer, gérer et explorer de manière intuitive de vastes archives musicales, le projet Cuidado
2 de l'Ircam s'attache à mettre au point l'équivalent de moteurs de recherche. Le premier,
Sound Palette, est destiné aux sons, le second,
Music Browser, aux œuvres musicales.
Dans l'atmosphère feutrée de l'Ircam, Hugues Vinet, directeur du Laboratoire Ircam-CNRS et coordinateur du projet, écoute en boucle des fragments de son, les manipule, et les analyse. «
Nous essayons de mettre au point des procédés de description automatique basés sur le contenu sonore », explique-t-il.
De la couleur musicale à la structure harmoniqueDeux voies sont explorées simultanément. Dans l'approche «
bottom-up », le signal brut est le point de départ pour définir des attributs comme le timbre, la couleur musicale ou l'attaque d'une note. L'approche «
top-down », au contraire, est centrée sur la perception de l'utilisateur. Des études expérimentales ont montré que les différents timbres se répartissaient selon trois dimensions. La hauteur du son ou l'énergie ressentie peuvent aussi être quantifiées. Ces paramètres, dits de haut niveau, sont cependant délicats à interpréter pour un morceau entier.
D'autres descripteurs sont alors créés. La proximité culturelle entre deux compositeurs est définie statistiquement par le nombre de programmes radiophoniques ou de pages web qui les citent conjointement. Mais «
l'analyse structurelle de la musique constitue le cœur de nos travaux », affirme Hugues Vinet. Les variations des paramètres acoustiques permettent d'identifier les motifs rythmiques, mélodiques et harmoniques (les « patterns »), et de dégager la structure d'un morceau.
Une arme contre le piratageLes possibilités offertes par cette analyse musicale sont nombreuses : en plaçant bout à bout les premières mesures de chaque mouvement, on peut construire des résumés musicaux. Suivant le même principe, une signature acoustique est réalisée. Elle est 1 700 fois plus légère que les données musicales, «
et permet d'identifier un morceau après seulement 10 secondes d'écoute. Une arme de choix dans la lutte contre le piratage », précise Hugues Vinet. L'automatisation de l'édition de partitions, de la création d'œuvres, ou du classement selon le style sont d'autres applications possibles.
Ces procédés de descriptions sont regroupés au sein des deux logiciels :
Sound Palette et
Music Browser.
Sound Palette est destiné aux bruiteurs et aux compositeurs, qui pourront rechercher des sons de timbre ou d'attaque semblables. Grâce au
Music Browser, les gestionnaires de catalogues musicaux et les programmateurs de radio pourront dénicher des morceaux sur la base de similarités rythmiques, harmoniques, ou culturelles. Des «
playlists » seront éditées d'un simple clic.
Le projet Cuidado, démarré en janvier 2001, s'inscrit dans l'élaboration de la norme interna-tionale MPEG7 de description des contenus audiovisuels. Mais «
au-delà des enjeux scientifiques relatifs à la description des contenus sonores, notre objectif, avec ces outils, est d'apporter de la valeur ajoutée à la musique en ligne », s'enthousiasme Hugues Vinet. Restent à définir les modalités juridiques de sa distribution.