LALAL.AI a un nouvel algorithme de Cassiopée qui va vous épater

31 mars 2021 Hibou Gourou

Séparer différentes parties d'une chanson sans avoir la racine réelle est difficile, mais il existe un outil appelé LALAL.AI qui est tout à fait capable de gérer le processus. Il divise les chansons entre les voix et les instrumentaux avec un minimum d'effort et aucune compétence en ingénierie audio requise.

Et si LALAL.AI était déjà assez solide, il a récemment fait un énorme pas en avant grâce à l'introduction de sa nouvelle architecture de réseau neuronal appelée Cassiopeia. Cela prend Rocknet, le réseau de neurones de la génération précédente du service, et le rend meilleur à presque tous les égards.

Qu'est-ce que Cassiopée de LALAL.AI apporte à la table?

Pour le dire très simplement: Cassiopeia fournit des résultats de fractionnement améliorés avec beaucoup moins d'artefacts audio. Le but de LALAL.AI est d'extraire et de séparer les voix et les instruments d'une piste, donc avoir une fonctionnalité qui peut améliorer la capacité est génial.

Avec le nouveau réseau de neurones, LALAL.AI prendra un peu plus de temps pour générer les pistes séparées, mais c'est un petit compromis pour la grande amélioration de la qualité.

Alors qu'est-ce qui est différent? Fondamentalement, Rocknet, qui est toujours utilisable sur LALAL.AI, ne considère que la composante d'amplitude tout en ignorant la composante de phase. Le nouveau réseau neuronal Cassiopeia prend en compte la composante de phase du signal d'entrée et génère la phase pour le signal de sortie. Grâce à ce processus, les pistes séparées contiendront moins d'artefacts audio.

Pour mettre tout cela en termes simples, le nouvel algorithme approfondit l'analyse de la chanson pour créer un meilleur partage.

Pour prouver que son service fonctionne plus efficacement, LALAL.AI l'a testé contre Spleeter, OpenUnmix et Extended Unmix. Il a également comparé les résultats à son propre réseau de neurones Rocknet. Vous pouvez voir les résultats complets du test sur le blog de LALAL.AI , mais fondamentalement, Cassiopeia a surpassé tous les autres dans la plupart des catégories dans divers genres choisis au hasard comme le jazz, le soft rock, la pop, etc.

Fait intéressant, Rocknet fonctionne toujours mieux dans le canal vocal. Cassiopeia a un peu plus d'infiltration des instrumentaux dans les voix. Cependant, LALAL.AI a souligné que les chiffres ne racontent pas toujours toute l'histoire et que parfois la qualité sonore peut en fait être différente de ce que les tests montrent.

Voici ce que la société a dit à ce sujet:

Bien que Cassiopeia soit en retard sur Rocknet en termes de métriques formelles pour le chant, la partie instrumentale et en particulier la tige vocale séparée par Cassiopeia sonnent beaucoup plus naturelles et plus douces que celles de Rocknet, sans les artefacts au son métallique si caractéristiques des autres solutions.

J'ai testé les résultats pour moi-même et j'ai trouvé que le réseau neuronal Cassiopeia entraînait des fractionnements audio plus nets. La piste vocale n'avait presque aucune infiltration perceptible des instrumentaux, ce qui est exactement ce que vous attendez d'un outil comme LALAL.AI

Cela dit, les résultats de Rocknet étaient encore assez bons, et ils étaient absolument utilisables pour isoler la piste vocale des instrumentaux.

Comment essayer la nouvelle fonctionnalité Cassiopée de LALAL.AI?

Si vous voulez donner une chance au nouveau réseau de neurones, vous pouvez aller à LALAL.AI et vous assurer que la case Utiliser le nouvel algorithme est cochée en bas de l'écran lorsque vous téléchargez une chanson.

Vous pouvez également choisir le niveau d'agression utilisé par l'algorithme pour fractionner les pistes. Normal est bon pour la plupart des pistes, mais vous pouvez expérimenter avec Mild et Aggressive pour voir ce qui crée une meilleure piste pour vous.