Bannière Recherche Recherche

Laboratoires.Ecoles, Collège et Formation doctorales 

Stratégie. Séminaires, colloques. Sciences et société

Réseaux et pôles d'excellence. Investissements d'avenir (Labex)

Licence Creative Commons Reconnaissances de scènes audio par architecture profonde / Mise en oeuvre du Deep Learning au CRIANN

30 janvier 2017
Durée : 00:41:05
Nombre de vues 6
Nombre d’ajouts dans une liste de lecture 0
Nombre de favoris 0
Alain RAKOTOMAMONJY / Benoist GASTON / GRICAD

Machines can now watch and interpret images, recognize speech and music genres, yet they are hardly capable of understanding daily life sound events e.g the sounds that occur in a kitchen at morning. 
Today's researches dealing with audio scene understanding are mostly limited to the problem of categorization and localization of few tens of sound event classes and environmental contexts. While such tasks are useful, the ultimate goal of audio scene understanding goes far beyond the assignment of labels to few kinds of sound events. Instead, it aims at developing machines that fully understand audio input. However, before making sense from audio, it is necessary to be able to recognize these audio contexts. 
In this talk, we present the results we achieved by performing representation learning (using deep learning) for classifying audio scenes.

Mots clés : gricad

 Informations

  • Ajouté par : Gricad Vidéos
  • Mis à jour le : 1 janvier 2021 00:00
  • Chaîne :
  • Type : Conférences
  • Langue principale : Français
Les commentaires ont été désactivés pour cette vidéo.