Comment Shazam reconnaît-il la musique avec précision?
Vous êtes-vous déjà demandé comment Shazam « entend '' la musique que vous jouez et l'identifie avec une telle précision? Eh bien, tu n'es pas seul.
La technologie qui alimente le service de reconnaissance musicale est un mystère pour beaucoup, d'autant plus que le service a été lancé des années avant que les smartphones et l'apprentissage automatique ne deviennent une chose.
Dans cet article, nous verrons comment fonctionne Shazam et comment il peut reconnaître la musique avec précision.
Qu'est-ce que Shazam?
Shazam est une application de reconnaissance musicale populaire que vous pouvez utiliser pour trouver des informations sur une nouvelle chanson que vous aimez mais que vous ne connaissez pas le titre ou le nom de l'artiste.
Disons que vous êtes dans un café ou que vous vous promenez dans un magasin du coin et que vous entendez une nouvelle chanson que vous aimeriez avoir dans votre bibliothèque musicale. Shazam vous aide à trouver facilement la chanson. Tout ce que vous avez à faire est d'enregistrer quelques secondes de la chanson sur l'application.
L'application Shazam utilise une technologie de reconnaissance audio sophistiquée pour identifier la musique que vous entendez en quelques secondes afin que vous puissiez trouver le nom de l'artiste et la piste, regarder des vidéos et même acheter ou diffuser la chanson sur votre appareil.
Télécharger: Shazam pour iOS | Android (gratuit)
Comment fonctionne Shazam?
Shazam utilise une technologie propriétaire développée par Avery Lin-Chun Wang, co-fondateur de l'application et chef des données scientifiques, pour identifier les correspondances des chansons interrogées sur sa plate-forme. La technologie crée des empreintes digitales pour les enregistrements audio, ce qui est la sauce secrète derrière les impressionnantes compétences de reconnaissance de Shazam.
Shazam crée et stocke des empreintes digitales audio constituées de collections de données numériques pour chaque plus de 15 milliards de chansons. Lorsqu'un utilisateur «Shazam» une chanson, Shazam crée rapidement une empreinte audio du son reçu du microphone du smartphone ou du PC.
Une fois que la création de l'empreinte audio pour l'enregistrement est terminée, Shazam télécharge l'empreinte audio (et non l'audio) sur son serveur, où il exécute une recherche de correspondance dans la base de données. Si une correspondance est trouvée, il renvoie les informations de la chanson avec des options sur l'endroit où la diffuser ou l'acheter, ainsi que les informations d'identification.
Qu'est-ce qu'une empreinte audio?
Une empreinte audio est un résumé numérique condensé des signaux audio. Ils sont utilisés pour identifier un échantillon audio ou pour localiser des éléments similaires dans une base de données audio.
La technologie d'empreinte audio de Shazam peut faire correspondre des éléments de contenu audio non étiquetés avec des correspondances correspondantes dans sa base de données audio. Shazam identifie le titre de la chanson que vous avez enregistrée (un contenu audio sans étiquette) en faisant correspondre l'empreinte digitale de la chanson avec l'empreinte digitale des chansons dans sa base de données.
Shazam crée des empreintes digitales uniques pour les chansons de sa base de données en utilisant certains points de données identifiés à l'aide d'un spectrogramme.
Qu'est-ce qu'un spectrogramme?
Un spectrogramme est un graphe tridimensionnel utilisé comme représentation du son. Le spectrogramme montre l'évolution des fréquences sur une période tout en tenant compte de l'amplitude ou du volume. La photo ci-dessous est un exemple de lecture de spectrogramme.
Dans une interview de 2003 avec Scientific American , Avery Wang a révélé que l'algorithme Shazam utilise des points de spectrogramme représentant des notes avec la plus grande énergie pour générer des empreintes digitales audio.
En ignorant la plupart des informations d'une chanson et en se concentrant uniquement sur les quelques notes déterminantes, Shazam peut rechercher dans sa base de données et fournir des correspondances précises pour les requêtes de chansons à une vitesse incroyable.
Comment Shazam est-il capable d'identifier les chansons dans les endroits bruyants?
Shazam utilise des enregistrements de chansons sans bruit de fond ni distorsion pour créer des empreintes digitales pour sa base de données. Lorsque vous enregistrez une chanson avec l'application dans un endroit bruyant, elle crée une empreinte audio de votre enregistrement en identifiant les notes avec la plus grande énergie sur l'enregistrement.
Il recherche ensuite dans sa base de données une correspondance avec les empreintes audio de votre enregistrement, à condition que le niveau de bruit de fond ne soit pas suffisamment élevé pour déformer les données utilisées pour créer l'empreinte audio.
Des moments où Shazam ne peut pas vous aider à identifier une chanson
Shazam est excellent pour associer des chansons, même des musiques obscures que vous pensez ne pas avoir dans sa base de données. Mais y a-t-il des moments où Shazam ne peut pas identifier une piste?
Enregistrement déformé
Lorsque vous Shazamez une chanson dans un endroit où le niveau de bruit de fond est trop élevé, le bruit déforme les données sur le spectrogramme. Pour cette raison, l'empreinte audio de votre enregistrement sera différente de celle de la chanson originale.
Lorsque cela se produit, Shazam renvoie le dialogue Song not Known car il ne trouve pas de correspondance pour l'empreinte audio.
Musique live
Shazam ne parvient pas à identifier la musique à partir de performances en direct. En effet, l'audio que vous enregistrez dans les performances en direct diffère souvent de la version originale de la chanson que Shazam utilise pour créer des empreintes digitales audio.
La seule façon dont Shazam peut identifier une chanson lors d'une performance live est si le groupe est suffisamment qualifié pour interpréter la chanson exactement comme elle a été enregistrée. Bonne chance avec le groupe qui essaie de faire ça…
Votre enregistrement vocal
«Pourrais-je amener Shazam à reconnaître une chanson que je chantais si j'étais un très bon chanteur?»
En bref, non.
L'algorithme Shazam ne peut identifier que la musique préenregistrée. Pour que Shazam identifie une chanson que vous chantez, vous devez avoir les mêmes voix avec les instrumentaux au tempo exact avec l'enregistrement original de la chanson.
Votre fredonnement
Shazam ne peut pas identifier les correspondances pour les ronflements car son algorithme utilise des fréquences et des amplitudes exactes pour créer des empreintes audio pour les chansons de sa base de données.
Lorsque vous fredonnez une chanson, Shazam crée une empreinte digitale pour elle. Mais comme un bourdonnement n'est qu'une tentative de resynthétiser une chanson, l'algorithme ne parviendra pas à correspondre à l'enregistrement.
Shazam est-elle la seule application d'identification musicale?
Shazam a été le premier service d'identification de musique et est actuellement l'application d'identification de chanson la plus utilisée. Cependant, il existe d' autres applications que vous pouvez utiliser pour identifier une chanson qui joue autour de vous. Certains peuvent même identifier une chanson que vous chantez ou fredonnez.
Trois des alternatives Shazam les plus populaires sont SoundHound, Musixmatch Lyrics et Genius. Musixmatch et Genius vous aident principalement à identifier les paroles de la musique jouée autour de vous, tandis que SoundHound est le concurrent le plus proche de Shazam.
Vous pouvez utiliser l'application SoundHound pour faire à peu près tout ce que fait Shazam. Son principal avantage par rapport à Shazam est qu'il a la fonctionnalité supplémentaire d'identifier les chansons que vous chantez ou fredonnez.
Crédit d'image: Sulastri Sulastri / Shutterstock.com