La nouvelle application d’IA de Meta s’adresse à la fois aux patients souffrant de lésions des cordes vocales et aux PNJ en jeu
Meta (anciennement Facebook) présente sa première offre d'intelligence artificielle depuis l'explosion de l'industrie des générateurs d'IA fin 2022.
Le générateur de texte en audio de la marque, appelé Voicebox, devrait être l'équivalent vocal de ChatGPT , qui traite les invites de texte en résultats écrits détaillés, et Dall-E qui développe des illustrations réalistes. Voicebox pourra à son tour accepter des invites textuelles et produire des clips audio, selon Engadget .
Après avoir formé le nouveau générateur sur plus de "50 000 heures d'audio non filtré", y compris la parole du domaine public et les transcriptions en anglais, français, espagnol, allemand, polonais et portugais. Voicebox est prêt à développer des résultats dans un discours à consonance conversationnelle dans une variété de langues disponibles. Meta affirme également que son modèle a une dégradation du taux d'erreur de 1%, par rapport aux autres modèles.
Selon les chercheurs de Meta, le modèle a été formé en lui faisant prédire des blocs de parole dans une transcription au lieu d'avoir à développer un ensemble de travaux à partir de zéro. L'outil a également la capacité d'éditer des clips audio pour les bruits indésirables ou les mots mal prononcés, de la même manière qu'un logiciel d'édition d'images fixes, tel qu'Adobe Photoshop .
Meta a déclaré qu'il ne prévoyait pas de publier l'application Voicebox ou le code source pour le moment en raison des "risques potentiels d'utilisation abusive". Cela est compréhensible car récemment, le Federal Bureau of Investigation (FBI) a émis un avertissement concernant l'utilisation croissante de contenu profondément faux dans les crimes, y compris l'extorsion, le chantage et le harcèlement.
La société a publié des échantillons audio avec son document de recherche présentant l'application. Il a également détaillé les plans futurs potentiels pour aider "les patients souffrant de lésions des cordes vocales, les PNJ dans le jeu et les assistants numériques".
Meta est dans une position intéressante pour essayer de suivre les tendances actuelles de l'industrie. Malgré plusieurs modèles de ses casques Meta Quest VR, il semble que la société n'avance plus dans ses projets de développement de son concept de métaverse en faveur d'une plus grande innovation en matière d'IA. Pendant ce temps, Apple a récemment présenté son premier casque Vision Pro et investit dans la réalité virtuelle. Actuellement, Apple n'a pas montré d'intérêt majeur pour l'IA.