Cette nouvelle application magique est une IA Ron Burgundy pour votre téléphone

l'application de lecture ElevenLabs sur un iPhone
OnzeLabs

Même si OpenAI retarde sa fonctionnalité de synthèse vocale pour ChatGPT, la startup audio IA ElevenLabs a publié mercredi son application Reader pour iOS , un modèle qui promet de lire à haute voix les mots de pratiquement n'importe quelle source de contenu, y compris les articles de presse, les PDF, les ePubs et les newsletters. – même coller des liens Web.

Les utilisateurs pourront choisir parmi une bibliothèque de « voix humaines de haute qualité » à écouter et pourront contrôler la rapidité avec laquelle la voix modulée par l'IA leur lit le texte. L'application Reader est disponible sur iPhone, iPad et iPod Touch (tout ce qui exécute iOS et iPadOS 15 ou version ultérieure) pour les utilisateurs aux États-Unis, au Royaume-Uni et au Canada. La société prévoit de lancer le logiciel dans l'UE « dans quelques semaines » vers le 11 juillet. Une version Android est actuellement en préparation et la société propose une liste d'attente aux utilisateurs intéressés.

ElevenLabs envisage déjà des mises à jour du service, notamment la lecture hors ligne, l'accès aux flux RSS, le résumé de l'IA et la possibilité de partager des extraits avec des amis. La société cherche également à étendre les langues parlées aux 29 langues prises en charge par son modèle multilingue.

"Créer les meilleurs modèles audio d'IA ne suffit pas", indique l'annonce d'ElevenLabs mercredi. « Les créateurs ont besoin d’outils grâce auxquels ils peuvent créer. Et les consommateurs ont besoin d’interfaces grâce auxquelles ils peuvent consommer de l’audio. La société finira par commencer à facturer le service (étant donné que son site Web indique que les trois premiers mois d'utilisation sont gratuits), bien que l'on ne sache pas encore ce que pourrait coûter cet abonnement.

Les modèles vocaux générés par l'IA d'ElevenLabs sont formés sur des données du domaine public, des données acquises dans le cadre d'accords avec des partenaires commerciaux et des données accessibles au public, selon un précédent rapport sur les tendances numériques . Grâce à eux, la société est en mesure d'offrir une variété de services, du doublage et de la traduction automatique au clonage de voix et à la narration automatique, générant même des voix d'IA pour les PNJ construits sur Unreal Engine.