Ne soyez pas trop enthousiasmé par les fonctionnalités d’IA du Samsung Galaxy S24

Un rendu d'un Samsung Galaxy S24 jaune.
Arsène Lupin / X

"Une nouvelle ère de l'IA mobile." C'est ainsi que Samsung présente sa prochaine gamme de smartphones de la série Galaxy S24 . Pour son événement Unpacked qui aura lieu plus tard ce mois-ci, la société promet « une toute nouvelle expérience mobile alimentée par l’IA ».

Samsung ne sera pas le premier nom à se lancer dans le battage médiatique de l'IA suscité par ChatGPT et Midjourney . Les deux poids lourds du silicium pour smartphones – Qualcomm et MediaTek – ont récemment fait un grand show sur les capacités d’IA générative intégrées à l’appareil de leurs derniers processeurs phares et de milieu de gamme.

Le changement est évident. L’IA va devenir le mot à la mode en marketing pour les téléphones. Mais qu’est-ce qui nous attend exactement ? La manière dont ces soi-disant « avancées de l’IA » vont ajouter une valeur significative reste un secret. Ou peut-être s'agit-il simplement d'une astuce existante en attente d'être reconditionnée sous un autre nom ou une autre application native.

Samsung peut livrer la marchandise ou faiblir de façon spectaculaire

Teaser pour Galaxy AI de Samsung.
Il vaudrait mieux que ce ne soit pas un gadget, Samsung. Samsung

Commençons par les téléphones de la série Galaxy S24. Ils seront livrés avec la puce Snapdragon 8 Gen 3 de Qualcomm . Le fabricant de puces fait des déclarations audacieuses sur les capacités d’IA générative de son nouveau chipset de premier plan. Par exemple, il est censé produire une image à partir d’invites de texte en une seconde en utilisant la technologie Stable Diffusion AI .

Qualcomm a proposé une explication technique fascinante sur la façon dont il a optimisé la technologie de diffusion stable pour le fonctionnement sur l'appareil. Rival MediaTek affirme également que les capacités d'IA intégrées à l'appareil de son produit phare Dimensity 9300 permettront la génération de texte en image en moins d'une seconde grâce à Stable Diffusion.

À l'heure actuelle, nous disposons déjà d'un téléphone alimenté par le dernier produit phare de Qualcomm. L'appareil en question est l' iQoo 12 , mais il est intéressant de voir que les supports marketing du téléphone ne mentionnent aucune astuce d'IA générative, en particulier celle vantée par Qualcomm et MediaTek.

Supposons que Samsung soit destiné à offrir cette fonction de génération de texte en image. Qu’est-ce que cela va accomplir en fin de compte ? Pour le moment, nous ne savons pas si l'astuce de conversion texte-image sera intégrée à une application tierce ou si Samsung l'intégrera dans l'une de ses applications.

La vraie question est de savoir quelle valeur cela va-t-il ajouter à nos habitudes d’utilisation quotidienne des smartphones. Que va faire un acheteur moyen de Galaxy S24 avec des images générées avec une seule ligne de texte ? Peut-être utiliseront-ils ces images générées par l’IA pour ajouter du piquant aux discussions ou faire du buzz sur les réseaux sociaux.

Mais il y a encore quelques frictions ici. Vous devrez générer ces images à partir d'une ligne de texte, les enregistrer localement (ou les copier directement dans le presse-papiers), puis coller ces images IA dans l'application de chat de votre choix. La solution la plus optimale serait que Samsung intègre d'une manière ou d'une autre l'astuce de génération d'image en texte directement dans le clavier.

Démo Stable Diffusion de Qualcomm pour téléphones.
Qualcomm

Encore une fois, pourquoi se donner tant de mal quand les emojis, les GIF et les autocollants peuvent faire l’affaire ? De plus, la résolution de 512 x 512 pixels n’est pas une résolution suffisante pour intégrer ces images générées par l’IA dans un devoir universitaire ou une présentation de travail.

De plus, le système ne sera probablement pas gratuit. La vidéo de démonstration de MediaTek mentionne qu'une option Premium est sur la table. Les acheteurs du Galaxy S24 pourraient finir par se heurter à une limite pour les jetons texte-image lorsqu’ils atteignent un certain nombre de sorties, après quoi ils seront soit rétrogradés à un niveau de vitesse de génération d’image plus lent, soit invités à payer des frais d’abonnement.

Mais si telle est la réalité, alors tout cela est sans objet car nous disposons déjà de solutions telles que Dall-E d’OpenAI . Vous pouvez l'obtenir pour générer des images gratuitement ou payer pour ChatGPT Plus pour profiter des avantages d'une génération d'images plus rapide et plus détaillée avec le dernier modèle Dall-E 3. Ce n'est qu'un des nombreux générateurs de texte en image disponibles.

Qualcomm affirme que le Snapdragon 8 Gen 3 est le « premier à prendre en charge les modèles multimodaux Gen AI ». Cela signifie que le chatbot (basé sur le modèle Llama de Meta) fonctionnant nativement sur un téléphone acceptera les entrées sous forme de texte et d'images, ainsi que la voix. Encore une fois, ce n'est pas unique, puisque ChatGPT-4 offre déjà cette fonctionnalité, bien que derrière un mur d'abonnement.

En avons-nous vraiment besoin ?

Snapdragon AI Assistant sur les téléphones.
Qualcomm

L’une des fonctionnalités les plus prometteuses annoncées par Qualcomm est l’expansion de l’image IA. Essentiellement, vous pouvez étendre le canevas d'une image dans n'importe quelle direction, et l'IA générative intégrée à l'appareil générera intelligemment des pixels en fonction de votre invite de texte et ajoutera plus d'objets au cadre d'origine.

C'est incroyable d'assister à cette astuce : voir une image s'agrandir avec l'ajout de plus d'objets et l'horizon s'élargir comme si un maître peintre retouchait son œuvre. Mais vous ne voulez pas faire cela avec les images sur lesquelles vous cliquez sur un téléphone pour les enregistrer en mémoire. Utiliser l’expansion de l’IA générative sur eux, c’est comme polluer vos souvenirs avec de faux visuels et des scénarios que vous n’avez jamais réellement vécus.

La synthèse est un autre pari important pour le déploiement de l’IA générative sur les téléphones. C'est idéal pour lire l'actualité et se tenir au courant des derniers développements dans différents domaines. Cependant, cette astuce ne se démarquera que s’il y a un minimum de friction. Par exemple, si les utilisateurs peuvent résumer un article d’actualité sur la même page du navigateur au lieu d’ouvrir une autre application.

Si tel est le cas, pourquoi ne pas simplement passer à une application qui le fait déjà ? Par exemple, Artifact est une application époustouflante conçue par le co-fondateur d'Instagram, Kevin Systrom , qui utilise l'IA pour résumer les articles pour vous.

Il existe déjà des applications et des sites Web qui proposent des informations sous forme de pépites résumées, comme Inshorts. Pour votre boîte de réception, Shortwave est une excellente application qui peut faire plus que simplement résumer les chaînes de courrier électronique pour vous, sans frais supplémentaires.

Envoi d'un résumé par e-mail en ondes courtes
Des applications comme Shortwave sont idéales pour résumer vos chaînes de courrier électronique. Nadeem Sarwar / Tendances numériques

L’IA générative sur appareil promet également des astuces telles que la retouche photo vocale. Cela semble incroyablement pratique, mais il est difficile d'imaginer à quel point cela ajoutera de la commodité à nos vies lorsque les filtres en un seul clic et les curseurs granulaires offrent un flux tout aussi rapide et plus gratifiant pour éditer des médias sur les téléphones.

Passons ensuite à la situation fondamentale de l'utilisation de l'IA uniquement pour lancer des discussions génériques ou pour obtenir des réponses qui nécessiteraient autrement une recherche alimentée par Internet. Une fois de plus, nous allons nous heurter à des problèmes qualitatifs.

Les modèles d'IA générative fonctionnant nativement sur les téléphones – comme Meta's Llama – ne sont pas les plus avancés de leur type en raison de la disponibilité fondamentale des ressources. Ne cherchez pas plus loin que Google. Le Pixel 8 Pro n'exécute que le plus petit des grands modèles linguistiques de Google appelé Gemini Nano . Pourquoi ne pas passer à quelque chose comme ChatGPT ou Pi via leurs applications mobiles dédiées au lieu de vous contenter d'un modèle de langage moins performant ?

Là où l’IA générative doit vraiment être

Assistants IA comparés à ChatGPT.
Nadeem Sarwar / Tendances numériques

À l’heure actuelle, là où je vois l’IA générative faire son meilleur travail, c’est en dissociant les tâches des smartphones du cloud (et l’obligation d’être en ligne tout le temps) et en offrant une touche de sécurité supplémentaire. Mais pour ce faire, ces astuces d’IA intégrées à l’appareil doivent servir d’assistant, un peu comme l’Assistant Google, Alexa ou Siri.

Ou mieux encore, ils doivent faire partie de l'assistant. Dites à votre assistant d'IA générative de récupérer toutes les images de chats de votre bibliothèque, de les intégrer dans un collage et de les envoyer à votre père. Ou demandez-lui de planifier le meilleur itinéraire pour une excursion d'une journée à Disneyland, de vous trouver le billet le moins cher pour le week-end prochain et d'organiser soigneusement tous ces détails sur Google Agenda.

De plus, si un outil d’IA générative intégré à l’appareil ne transmet plus vos données aux serveurs cloud et conserve chaque opération localement sur votre smartphone, il n’y a pas lieu de s’inquiéter de la confidentialité des données. Du moins en théorie, c'est vrai. Pour l’instant, je ne suis pas sûr de la vision Galaxy AI que Samsung vend, mais il serait intéressant de voir si Samsung peut vraiment offrir des expériences d’IA génératives significatives ou simplement un tas d’astuces à peine pratiques et fantaisistes.