Le très attendu Advanced Voice de ChatGPT pourrait arriver « la semaine prochaine »

capture d'écran. deux personnes assises à un bureau discutant en mode vocal avancé d'OpenAI sur un téléphone portable
OpenAI

Le PDG et co-fondateur d'OpenAI, Sam Altman, a révélé jeudi sur X (anciennement Twitter) que sa fonctionnalité Advanced Voice commencerait à être déployée « la semaine prochaine », mais uniquement pour quelques abonnés ChatGPT-Plus sélectionnés.

La société prévoit de « démarrer l’alpha avec un petit groupe d’utilisateurs pour recueillir des commentaires et développer en fonction de ce que nous apprenons ».

Advanced Voice, qui supprime l'invite de texte et permet aux utilisateurs de converser directement avec l'IA comme avec un autre humain, a été initialement annoncé en mai parallèlement à la sortie de GPT-4o lors de l'événement Spring Update de la société. Contrairement aux assistants numériques existants comme Siri et Google Assistant, qui fournissent uniquement des réponses prédéfinies aux requêtes des utilisateurs, Advanced Voice de ChatGPT fournit des réponses de type humain, presque sans latence et dans plusieurs langues.

Le modèle GPT-4o est capable de répondre aux entrées audio en 320 millisecondes en moyenne , ce qui est comparable à la rapidité avec laquelle les humains réagissent à une conversation normale. Comme vous pouvez le voir dans la vidéo de démonstration ci-dessous, le modèle peut converser avec plusieurs utilisateurs simultanément, improviser des points de discussion et des questions en anglais et en portugais, ainsi que les transmettre avec des émotions humaines, y compris le « rire ».

On ne sait pas encore comment la société choisira les participants pour l'essai alpha, mis à part qu'ils seront abonnés au niveau ChatGPT Plus à 20 $/mois. La version alpha était initialement prévue pour juin, bien que cette date ait été repoussée « pour atteindre notre barre de lancement » et améliorer sa capacité à détecter et rejeter les formes de contenu interdites, ainsi qu'à renforcer l'infrastructure informatique de l'entreprise pour s'adapter à la charge d'utilisateurs prévue. augmenter.

Comme la société l'a annoncé en juin , le déploiement complet de la fonctionnalité n'aura lieu qu'au moins cet automne, et son calendrier exact dépendra, encore une fois, du fait qu'elle « satisfasse à nos exigences élevées en matière de sécurité et de fiabilité ».

Donner à ChatGPT la possibilité de converser naturellement avec ses utilisateurs constitue un énorme progrès. L'élimination du besoin d'une fenêtre contextuelle réduit les exigences matérielles des utilisateurs et élargit les intégrations potentielles et les cas d'utilisation de l'IA (comme l'augmentation de l'accès aux utilisateurs ayant des limitations de mobilité corporelle ou de dextérité).

Cela peut également contribuer à accélérer l'adoption de la technologie par le public en réduisant les barrières à l'entrée pour les utilisateurs moins avertis en technologie, qui sont à l'aise avec l'interaction avec leur ordinateur via « Hey Siri », mais pâlissent à la perspective d'une ingénierie rapide.