La suite d’outils d’IA de Google surpasse ChatGPT et se classe en tête de l’App Store ! Guide d’utilisation inclus
Vous pensiez que ChatGPT resterait en tête du classement ? Mais cette semaine, les choses ont changé.
Google Gemini, avec son logiciel d'édition d'image Nano Banana, récemment très populaire, est arrivé en tête de la liste gratuite de l'App Store , repoussant ChatGPT à la deuxième place.
Gemini se classe premier toutes catégories confondues dans la liste des applications gratuites de l'App Store. Source de l'image : https://apps.apple.com/us/charts/iphone/top-free-apps/36 ; 15/09/2025
Cela signifie que Google a finalement connu son propre « moment explosif d’IA ».
Et Gemini n'est que la partie émergée de l'iceberg. Google propose également une suite complète d'outils d'IA, allant de l'écriture et du dessin à la prise de notes et à la création de vidéos. Aujourd'hui, nous allons présenter la suite complète d'IA de Google.
Version à économie de débit :
- Gemini, comme ChatGPT, est un assistant polyvalent . Il inclut des fonctionnalités telles que Nano Banana (un modèle d'image brute populaire), Canvas, la génération de vidéos Veo3, Storybook et Deep Research. Les versions Gemini 2.5 Pro et Flash sont actuellement disponibles. Rendez-vous sur gemini.google.com pour en faire l'expérience.
- NotebookLM, une base de connaissances pour des recherches approfondies : vous pouvez télécharger jusqu'à 300 fichiers et synthétiser des documents en six types, dont audio, vidéo et cartes mentales. C'est l'outil idéal pour l'apprentissage et la recherche. Adresse : notebooklm.google
- Flow, génération de vidéos haute qualité : écran vertical 9:16, HD 1080p, prix réduit ; les utilisateurs gratuits recevront 100 points par mois. Adresse de l'expérience : flow.google
- Le mode IA permet à la recherche de raisonner et de réfléchir : vous pouvez l'ouvrir directement dans le champ de recherche Google pour obtenir des résultats plus précis et détaillés que le résumé/aperçu IA. Il est actuellement disponible en cinq langues, dont l'anglais (mais pas le chinois). Découvrez-le sur : google.com/ai
- Gemini CLI : un assistant local polyvalent : non seulement un outil de développement, mais aussi capable de télécharger des vidéos, de convertir des GIF et de compresser des fichiers. Lien d'expérience : github.com/google-gemini/gemini-cli
- AI Studio et Labs Google : Autres gadgets intéressants, générer un morceau de musique, apprendre facilement une nouvelle langue, découvrir le modèle de langage Google le plus récent et le plus complet… Adresse de l'expérience : ai.dev et labs.google
Gemini : Plus qu'une simple application de chat, c'est aussi une station de travail polyvalente.
La nano banane récemment populaire a sa principale chaîne officielle, en plus de la version Web, l'application Gemini.
▲ Page d'accueil de Gemini, avec un rappel permanent faisant la promotion du modèle d'édition d'images nano banane
Mais si vous n'utilisez Gemini que pour la retouche photo, ce serait du gaspillage. Comme ChatGPT, il complète la fonction « mémoire » des conversations et s'intègre parfaitement à l'écosystème Google.
▲ Fonction « Mémoire » de Gemini
Pour moi, cette mise à jour clé, combinée à l'abonnement Pro gratuit fourni avec EducationMail, me suffit pour transférer la plupart de mes conversations quotidiennes.
Google a récemment mis à jour les limites d'utilisation spécifiques pour les utilisateurs de Gemini (version gratuite et payante). Les utilisateurs de la version gratuite ont un accès limité à Gemini 2.5 Pro et à Deep Research, mais le prix de Nano Banana est très abordable, ce qui leur permet également de bénéficier d'une généreuse opportunité de génération de 100.
Source de l'image : https://support.google.com/gemini/answer/16275805
Le principal avantage de Gemini 2.5 Pro réside dans le fait que chaque réponse bénéficie d'un raisonnement clair, similaire à celui de DeepSeek, mais beaucoup plus rapide. Cet avantage est encore plus évident depuis la mise à jour de ChatGPT vers GPT-5, qui adopte un nouveau contrôle de routage et la sélection automatique de modèles.
Parce que ChatGPT ne peut parfois pas juger quel modèle je veux qu'il utilise pour répondre ; et mon expression n'est pas toujours assez claire pour que le modèle comprenne mon intention.
Cependant, être un programmeur bavard a pour prix d'être un expert en productivité. Comme le montre le classement LMArena, Gemini se classe premier en développement de texte, mais ses capacités de développement web sont inférieures à celles de GPT et Claude. Heureusement, Google a activement mis à jour Gemini ces derniers temps, améliorant ainsi l'expérience utilisateur lors des interactions avec les logiciels.
▲Gemini et ChatGPT effectuent la même tâche de développement, laquelle préférez-vous ?
Par exemple, dans le développement Web, Gemini Canvas prend désormais en charge le clic direct sur un élément de l’application et la réalisation de modifications à l’aide du langage naturel.
L'aperçu de la toile de Canvas et ChatGPT a la même fonction, tous deux très intuitifs, transformant notre créativité en applications, jeux, infographies et autres contenus.
▲ Nouvelles fonctionnalités du canevas Gemini : Sélectionner et Demander. Vous pouvez désormais modifier intuitivement n'importe quelle partie de votre application web en cliquant simplement sur l'élément et en décrivant les modifications souhaitées. Source de l'image : https://x.com/GeminiApp/status/1965475292526551105
Deuxièmement, Gemini prend enfin en charge le téléchargement de fichiers audio. Ainsi, les documents riches en contexte, tels que les enregistrements de réunions et les vidéos d'entretiens, peuvent être directement transmis à Gemini pour traitement, éliminant ainsi les difficultés d'organisation et de rédaction manuelles de questions complexes.
▲ ChatGPT continue de répondre que l'outil ne peut pas être utilisé
La dernière nouvelle est que selon la communication entre le fondateur de Flowith, Derek Nee, et l'équipe d'ingénierie de Gemini 3, il a révélé que les capacités de Gemini 3.0 Flash dépasseront 2.5 Pro.
Source de l'image : https://x.com/DerekNee/status/1965811795559653506
Similaires aux conditions utilisées par ChatGPT, Gemini peut avoir des restrictions supplémentaires sur l'emplacement des comptes Google.
Adresse de l'expérience : gemini.google.com
NotebookLM : votre meilleure base de connaissances personnelles
Vous avez sauvegardé de longs articles et extraits de livres en anglais, mais vous finissez toujours par les « lire plus tard » ? NotebookLM est conçu pour les protéger de la poussière.
Il vous suffit d'y ajouter quelques articles, rapports ou même extraits de livres, et cela :
- Vous aide à extraire automatiquement les points clés et à générer une note d'étude claire et organisée ;
- Si vous aimez la visualisation, vous pouvez également dessiner directement une carte mentale, afin de pouvoir comprendre le cadre de l'article en un coup d'œil ;
- Envie d'en savoir plus ? Des quiz basés sur le contenu peuvent également vous être proposés pour vous inciter à réviser et consolider vos connaissances.
Par exemple, je l'ai déjà utilisé pour organiser des documents. NotebookLM permet de télécharger jusqu'à 300 fichiers et prend en charge une grande variété de formats, notamment les PDF, les fichiers texte, les fichiers Markdown, ainsi que les fichiers audio et vidéo. Il les reconnaît.
▲ J'ai téléchargé 297 articles dans le même domaine de recherche, et NotebookLM a pu générer des résumés de contenu sous diverses formes entièrement basés sur ces fichiers.
▲ Six formats : rapport textuel, aperçu du podcast, introduction vidéo, carte mentale, flashcards et quiz
Les podcasts et les rapports textuels ont été les premières options proposées dans NotebookLM, et ils ont désormais également été optimisés.
Les rapports textuels peuvent être générés directement sous forme de blogs, de documents d'instructions, de guides, etc. NotebookLM propose même des suggestions dynamiques basées sur les informations de la base de connaissances ; par exemple, le téléchargement d'un article peut suggérer la création d'un livre blanc, tandis que les articles de presse peuvent générer du contenu explicatif ; les invites personnalisées sont désormais également autorisées.
▲ Article de blog généré par NotebookLM
Les podcasts audio prennent désormais en charge plus de 80 langues, et les types de podcasts sont passés des aperçus au contenu approfondi, et se sont étendus à divers types tels que le débat et la pensée critique.
Les nouvelles vidéos, quiz et flashcards sont mes fonctionnalités préférées. NotebookLM est très utile, que ce soit pour assimiler les connaissances ou pour diffuser du contenu.
Cependant, les recherches présentées dans cet article portent sur un sujet relativement spécialisé ; nous l'utilisons donc uniquement pour présenter les fonctionnalités de NotebookLM. Pour les étudiants et les chercheurs, c'est sans aucun doute l'un des outils les plus recommandés de Google AI.
Dans des scénarios d'application plus généraux, il peut être utilisé pour créer tout type de base de connaissances. Par exemple, dans le cas d'utilisation officiel fourni par NotebookLM, une carte mentale est utilisée pour télécharger les rapports financiers du premier trimestre de plusieurs entreprises, permettant aux utilisateurs d'en comprendre clairement le contenu spécifique en un clin d'œil.
NotebookLM s'est également associé à OpenStax (un fournisseur de manuels gratuits) pour transformer son contenu populaire en cahiers interactifs, notamment des cahiers sur des sujets tels que la biologie, la chimie, la psychologie et la gestion.
Dans cette base de connaissances en psychologie, chaque chapitre est équipé de quiz et de cartes mémoire pour nous aider à consolider les points de connaissances que nous avons appris.
▲ Vous pouvez choisir le chinois comme langue. Lien vers la base de connaissances : https://notebooklm.google.com/notebook/90a2ee5f-cccb-4c28-a356-bb1682cc8aeb
Les thèmes et les niveaux de difficulté des quiz et des flashcards sont personnalisables. De plus, pour les flashcards comme pour les quiz, il suffit de cliquer sur l'explication pour approfondir le sujet. NotebookLM génère des aperçus détaillés pour vous aider à comprendre les définitions des flashcards ou à expliquer vos erreurs, ainsi que des citations de la source originale.
Adresse de l'expérience : notebooklm.google
Génération de vidéos cinématiques par IA Flow
Bien que les vidéos IA soient incroyablement populaires, la question de leur utilisation reste un sujet de préoccupation récurrent. Nous avons présenté plusieurs modèles de génération de vidéos IA, et de nombreux lecteurs ont émis la question : « À qui s'adressent réellement ces vidéos IA ? »
▲ Dans Gemini, utilisez directement la génération vidéo Veo 3. Veo 3 ne prend actuellement en charge que la première image, et les première et dernière images nécessitent Veo 2.
La mise à jour de Google pourrait apporter des réponses : la prise en charge de l'écran vertical (9:16) et de la HD 1080p. Cette fonctionnalité est sans aucun doute idéale pour les plateformes de vidéos courtes sur les réseaux sociaux comme TikTok, YouTube Shorts et Reels.
▲ Veo 3 récemment mis à jour, le prix de Veo 3 Fast est passé de 0,4 $ par seconde à 0,15 $ par seconde et prend en charge 9:16, 1080p, etc. Source de l'image : https://x.com/GoogleAIStudio/status/1965436154762920074
Aujourd'hui, la vidéo IA est devenue un nouveau produit de consommation. Plutôt que de la regarder passivement, mieux vaut l'essayer soi-même.
▲ Mots clés : Vidéo cinématographique ultra-réaliste de Shanghai, célèbre tour emblématique. Tournée au format vertical 9:16, style vlog de voyage, mouvement de caméra fluide, éclairage dynamique, couleurs vives, détails très précis, atmosphère immersive, sans texte ni filigrane.
En plus des modèles de génération vidéo populaires tels que Sora, KeLing et Conch, le Veo 3 de Google a toujours été parmi les meilleurs dans le domaine des grands modèles, dans la catégorie des vidéos Vincent.
Le voyage dans le temps à la première personne, la coupe de fruits ASMR, le métal, la surveillance de la vision nocturne sur trampoline de lapin et d'autres vidéos devenues virales il y a quelque temps ont toutes été générées à l'aide de Veo 3.
▲ Conseil : Caméra 50 mm, gros plan d'un citron en verre teinté jaune coupé horizontalement sur une planche à découper en bois. L'intérieur du fruit est également en verre, avec quelques paillettes fondantes. La scène entière est éclairée par un éclairage tamisé.
Cependant, la qualité des mots clés est le principal facteur déterminant la qualité de la vidéo. Par exemple, la vidéo ci-dessus est directement inspirée du dossier officiel de Google.
Ils ont expliqué qu'une bonne invite se compose de trois parties. La première est « caméra 50 mm, gros plan » pour préciser l'appareil ; la partie centrale sert à indiquer l'objet et le contenu vidéo spécifique ; et la dernière phrase précise l'éclairage et la texture.
Flow a des exigences réseau strictes et il suffit généralement de l'utiliser sur le site Web Gemini ou dans l'application.
Adresse de l'expérience : flow.google
Le mode IA prend en charge plus de langues que l'anglais
La recherche est la plus grande entrée de trafic, les navigateurs IA sont donc devenus un champ de bataille pour les grands fabricants de modèles, même si cette route n'est pas facile.
Après l'abandon du projet Arc, le navigateur Dia, relancé, a récemment été racheté par Atlassian pour 610 millions de dollars. Le problème n'est pas le manque de profits, mais plutôt le nombre impressionnant de géants technologiques désireux d'acquérir cette activité lucrative.
Le mois dernier, Microsoft a annoncé la mise à niveau de son navigateur Edge vers une version optimisée par l'IA. Copilot s'intègre parfaitement à chaque recoin du navigateur, permettant ainsi les réservations de restaurants et de vols, l'organisation croisée des tableaux, et bien plus encore. Lorsqu'OpenAI a lancé son agent ChatGPT, des rumeurs circulaient également sur le développement de son propre navigateur IA.
Bien sûr, Google ne s'arrêtera pas là. Contrairement à l'aperçu de l'IA que l'on voit habituellement lors des recherches sur Google, le mode IA s'apparente davantage à un rapport de recherche approfondi. Il utilisera le raisonnement avancé et les capacités multimodales de Gemini 2.5 pour traiter nos requêtes.
Par exemple, lorsque je lui demandais ce qui se passait avec la carte eSIM dans l'iPhone Air, il triait automatiquement le contenu de la page Web et donnait une réponse plus précise.
▲ Cliquez sur Tout ci-dessus pour revenir à la recherche Google normale
Le mode IA présente toutefois un inconvénient : il ne prend actuellement pas en charge le chinois. Cependant, il y a quelques jours, Google a annoncé la prise en charge de cinq langues supplémentaires, dont le japonais, le coréen et le portugais. L'entreprise a précisé que la création d'une recherche IA globale ne se limite pas à la traduction ; les langues prises en charge doivent être pertinentes et utiles au niveau local.
Adresse de l'expérience : google.com/ai
Gemini CLI télécharge des vidéos et convertit les formats de fichiers.
Peu importe que Claude Code soit en rupture de stock, Gemini CLI est vraiment facile à utiliser.
Nous avons déjà mentionné que l'utilisation de cet outil de terminal pour modifier les noms de fichiers est en réalité la méthode la plus faible. Dernièrement, j'utilise Gemini CLI pour tout, du téléchargement de vidéos depuis X Video et YouTube à la conversion de vidéos en GIF et autres formats, en passant par la compression d'images et de vidéos.
Le processus d'installation de Gemini CLI est assez clair, et même si vous rencontrez des problèmes de configuration de l'environnement, l'IA d'aujourd'hui peut fournir des solutions fiables.
Le problème initial concerne principalement l'installation de Node.js. Pour les utilisateurs Windows, l'utilisation du terminal n'est pas aussi conviviale que sous macOS et Linux ; un peu de patience est donc nécessaire.
Une fois Node.js installé, suivez les instructions sur GitHub et exécutez la commande npm/npx pour installer Gemini CLI.
En saisissant « gemini » dans le terminal, nous serons invités à effectuer une vérification. En général, une connexion avec Google Authentication suffit, sans nécessiter d'opérations supplémentaires telles que l'API Gemini. Les utilisateurs gratuits peuvent effectuer 60 requêtes par minute et 1 000 requêtes par jour, ce qui est suffisant pour des tâches quotidiennes simples.
Le terminal comporte des commandes très basiques. À l'ouverture du terminal, le dossier par défaut peut contenir les fichiers de l'ordinateur. Si nous utilisons directement Gemini, la récupération des fichiers sera difficile.
L'opération correcte consiste à entrer quelques commandes de base : ls : listera tous les fichiers et dossiers du répertoire courant ; cd xxx : entrera dans un dossier ; mkdir xxx : créera un dossier.
Par exemple, à la première étape, ouvrez le terminal et saisissez ls pour afficher tous les fichiers et dossiers du répertoire courant. Sélectionnez ensuite un fichier à traiter ; cette fois, il s'agit du dossier du projet Gemini. Saisissez cd Downloads pour afficher le nom du répertoire courant, Downloads, précédé du caractère %. Créez ensuite un dossier, mkdir testing, puis accédez-y à l'aide de cd testing. Vous pouvez également sélectionner directement un dossier, faire un clic droit et l'ouvrir dans le terminal. Saisissez gemini pour qu'il prenne officiellement le contrôle de votre terminal, vous permettant d'utiliser le langage naturel pour gérer de nombreuses tâches complexes.
Prenons l'exemple du téléchargement d'une vidéo appelée X. L'application recherche d'abord un outil appelé yt-dlp, permettant de télécharger des vidéos. Ensuite, elle vérifie automatiquement si l'outil est installé sur mon ordinateur. Une fois détecté, le téléchargement de la vidéo commence.
Ceci appelle l'outil yt-dlp. Dans l'environnement terminal, il existe de nombreux outils efficaces, comme FFmpeg, un outil puissant pour le traitement de contenu multimédia.
▲ Après avoir entré la commande, Gemini CLI vous indiquera directement qu'il a besoin de deux outils : yt-dlp et ffmpeg ; puis il ajustera automatiquement la résolution et la fréquence d'images pour correspondre à la taille de fichier finale que j'ai proposée, et enfin il supprimera les fichiers temporaires au cours du processus.
Nous continuons avec l'exemple de la vidéo X. Cette fois, nous lui demandons directement de télécharger la vidéo de ce lien au format GIF et de vérifier que la taille du fichier GIF est comprise entre 5 et 10 Mo.
Outre le téléchargement de fichiers depuis Internet, Gemini-CLI peut également traiter directement les fichiers locaux. Par exemple, si la taille d'une image ne correspond pas aux spécifications de la plateforme, je peux lui indiquer le nom du fichier et lui demander de la compresser. Nul besoin de recourir à des outils en ligne pour ce processus.
J'ai pu spécifier l'emplacement de l'image en langage flou, et il l'a localisée avec succès. Il a ensuite utilisé ffmpeg pour la compresser. Cependant, il a fini par supprimer mon fichier d'origine. Lorsque je lui ai demandé de le récupérer, il a modifié son fichier de configuration gemini.md ; celui-ci lui sert de « mémoire », lui permettant de retenir la leçon et d'éviter de reproduire la même erreur.
Il existe de nombreux types d'outils en ligne de commande, et la plupart des fichiers peuvent être traités. Parfois, si certains packages compressés ne peuvent pas être décompressés, Gemini CLI peut être utilisé pour les gérer directement sans télécharger les outils de décompression correspondants.
Associé au MCP (Large Model Context Protocol, une interface universelle permettant de connecter différentes données), Gemini CLI peut faire bien plus que du simple développement de programmation.
Adresse de l'expérience : https://github.com/google-gemini/gemini-cli
AI Studio et Labs Google : le terrain d'essai d'IA de pointe de Google
Google Labs héberge de nombreux produits basés sur l'IA qui n'ont pas encore été officiellement lancés. Des projets comme AI Mode et NotebookLM sont encore des produits de laboratoire, mais ils sont assez connus. Nous avons également sélectionné quelques projets plus modestes et intéressants. Bien que les modèles sous-jacents fonctionnent tous sur le même processeur Gemin 2.5 Pro/Flash, vous pouvez découvrir les différentes implémentations logicielles au sein de ces modèles.
Le premier est Whisk, un outil de génération d'images qui ne nécessite aucune invite et vous permet de télécharger des photos et de vous amuser. Il intègre désormais une fonction d'animation, qui convertit directement les images générées en vidéo.
▲ Adresse : https://labs.google/fx/tools/whisk
Il existe également des Petites Leçons de Langue pour apprendre une langue. Leur particularité réside dans le fait qu'elles permettent d'apprendre rapidement une nouvelle langue grâce à une série de petites expériences basées sur Gemini, de l'appliquer directement à des situations réelles et d'apprendre diverses expressions argotiques.
Je l'ai essayé en cantonais, et au moins ce n'était pas les mêmes vieux rouleaux de riz et les travers de porc à la sauce aux haricots noirs de Duolingo.
▲ Adresse : https://labs.google/lll/
Google Labs a beaucoup plus de projets, découvrez-les sur : labs.google
Nous avons parlé du grand modèle polyvalent Gemini 2.5 Pro, de la nano-banane d'édition d'images et de la génération vidéo Veo 3, alors comment ne pas parler d'Imagen 4 ?
Actuellement, Imagen 4 n'est disponible qu'avec l'API Gemini et AI Studio. Bien que Google Labs dispose d'un outil de génération d'images dédié, ImageFX, le modèle utilisé reste Imagen 3.
AI Studio vous permet de découvrir les modèles les plus récents et les plus complets de Google. De plus, les conversations d'AI Studio offrent une fonctionnalité de « branchement » vous permettant de démarrer un nouveau sujet tout en conservant le sujet existant.
Il y a quelque temps, Musk s'est disputé avec Ultraman sur X et s'est directement maudit, disant qu'Apple et Ultraman avaient un accord privé, sinon pourquoi son Grok ne pourrait-il pas être en tête de liste, et pourquoi c'était toujours ChatGPT.
Après l'avoir déballé, j'ai eu un aperçu des atouts de Gemini. L'IA de Google s'intègre parfaitement à nos processus d'apprentissage, de travail et de création grâce à un workflow complet. De l'organisation des données à la stimulation de la créativité en passant par la libération des mains, le cœur de cette suite complète est d'améliorer véritablement la productivité de chacun.
Lequel utilisez-vous le plus ou souhaitez-vous tester le plus ? Laissez un commentaire ci-dessous si vous avez des questions.
Veuillez cliquer sur le lien pour lire la vidéo sur WeChat https://mp.weixin.qq.com/s/gdSkrm95Mq1RORe-sIoK4A
#Bienvenue pour suivre le compte public officiel WeChat d'iFaner : iFaner (ID WeChat : ifanr), où du contenu plus passionnant vous sera présenté dès que possible.