Amazon dévoile sa nouvelle famille de modèles fondateurs Nova
Le PDG d'Amazon, Andy Jassy, est monté sur scène lors de la conférence re:Invent de l'entreprise mardi pour présenter six nouveaux modèles de génération de texte, d'image et de vidéo qu'il appelle Amazon Nova.
Cette nouvelle famille d'IA génératives multimodales comprend Nova Micro, un modèle textuel conçu pour des réponses à faible coût et à faible latence ; Nova Lite, un modèle multimodal à faible coût pour le traitement des entrées d'images, de vidéos et de texte ; et Nova Pro, son modèle multimodal à usage général qui combine « précision, vitesse et coût pour un large éventail de tâches », selon le message d'annonce de la société . Nova Premier est « le modèle multimodal le plus performant d'Amazon pour les tâches de raisonnement complexes », tandis que Nova Canvas est un moteur de conversion texte-image dédié et Nova Reel est spécialement conçu pour générer des vidéos.
Les modèles basés sur du texte ont été optimisés sur 15 langues différentes. Micro propose une fenêtre contextuelle de 128 000 jetons tandis que Lite et Pro peuvent gérer jusqu'à 300 000 jetons (environ 225 000 mots ou 30 minutes de vidéo). La société prévoit d'étendre les fenêtres contextuelles de ses modèles plus grands jusqu'à 2 millions de jetons d'ici le début de l'année prochaine.
Canvas permet aux utilisateurs de générer et de modifier des images à l'aide d'invites en langage naturel. Les bobines, qui rivaliseront avec Gen-3 Alpha , Kling et Dall-E 3 , peuvent générer des clips d'une durée maximale de six secondes à partir d'invites de texte et d'images de référence. Le générateur vidéo offre également un contrôle des mouvements de la caméra, notamment des panoramiques et des zooms.
« Nous avons continué à travailler sur nos propres modèles frontières », a déclaré Jassy à l'assemblée, « et ces modèles frontières ont fait d'énormes progrès au cours des quatre à cinq derniers mois. Et nous avons pensé que si nous en tirions de la valeur, vous en tireriez probablement de la valeur.
Jassy affirme également que ces modèles sont à la fois parmi les moins chers à exploiter et les plus rapides de leur catégorie, bien que la société n'ait pas encore publié de données de référence à l'appui de ces affirmations. « Nous avons optimisé ces modèles pour qu'ils fonctionnent avec des systèmes et des API propriétaires, afin que vous puissiez effectuer plusieurs étapes automatiques orchestrées (comportement des agents) beaucoup plus facilement avec ces modèles », a-t-il déclaré. "Je pense donc que ceux-ci sont très convaincants."
Les modèles Micro, Lite et Pro (ainsi que Canvas et Reels) sont tous actuellement disponibles pour les clients AWS. La première devrait arriver au premier trimestre 2025.