De Doubao à Kimi, pourquoi tous les produits d’IA créent-ils des plug-ins de navigateur ?

Mon navigateur est déjà entouré de divers plug-ins d'IA.

Ils occupent non seulement la barre d'outils dans le coin supérieur droit, mais se rassemblent également dans la fenêtre flottante dans le coin inférieur droit, rendant les minimalistes nerveux.

Depuis la guerre des Cent modèles, la principale contradiction d'un travailleur mature est devenue la contradiction entre le besoin d'améliorer sa productivité et la difficulté de choisir un assistant IA.

De ce point de vue, il faut trouver une autre façon de réaliser des plug-ins. La durée pendant laquelle je l'utilise dépend en fait de l'IA qui prend l'initiative de venir vers moi.

Des fonctions plus légères, une compagnie plus large

Les plug-ins de navigateur IA actuels peuvent être grossièrement divisés en trois catégories.

Une catégorie est constituée de produits compagnons basés sur ses propres grands modèles.

Le 8 juillet, l'assistant intelligent Kimi a lancé un plug-in de navigateur et nous avons rédigé un article d'expérience dès que possible . Auparavant, des développeurs tiers créaient également le plug-in "Kimi Copilot", mais cette fois, il a été officiellement implémenté personnellement.

Pourquoi lancer le plug-in ? Le fait est que nous ne pouvons pas tout faire sur le site principal de Kimi avec un dialogue en plein écran, mais le plug-in vous permet d'utiliser les fonctions d'IA à tout moment sur n'importe quelle page Web.

Imaginez que lorsque nous parcourons un site d'actualités pour lire un article, nous ne comprenons pas la terminologie ni ne reconnaissons les noms des personnes. Lorsque nous écrivons dans un document en ligne, nous ne sommes pas sûrs d'une certaine question, mais nous ne voulons pas. interrompez l'état actuel et passez à d'autres pages pour rechercher.

À ce stade, le plug-in Kimi peut instantanément rechercher, répondre aux questions et résumer le texte intégral… Quoi qu'il en soit, le plug-in joue également un rôle pour attirer du trafic, vous permettant d'accéder au site principal de Kimi avec un clic.

Le héros voit la même chose. Le concurrent de Kimi, Doubao, a lancé des plug-ins plus tôt. Il peut faire tout ce que Kimi peut faire. Dans différents scénarios de lecture et de création, les fonctions du plug-in Doubao sont légèrement différentes.

Sélectionnez un passage sur la page Web et le plug-in Doubao prend en charge la recherche, l'explication, le questionnement, la traduction, etc.

Lorsque vous ouvrez un document en ligne et sélectionnez un paragraphe, en plus des fonctions ci-dessus, le plug-in Doubao prend également en charge la correction grammaticale et l'ajustement du ton.

Ce que je trouve le plus pratique, ce sont en fait les deux fonctions plug-in de Doubao qui sont en avance sur celles de Kimi.

L'une concerne les fonctions de résumé vidéo, de carte mentale, de tri de la chronologie et de saut, qui sont applicables à la fois à YouTube et à Bilibili. Le plug-in Kimi ne peut pas encore résumer le contenu vidéo.

Il existe également une fonction de collecte Que vous trouviez des moments intéressants, des mises à jour de Weibo ou que vous voyiez un paragraphe utile dans un article, vous pouvez l'enregistrer sur le site Web principal de Doubao en un seul clic et joindre l'URL d'origine pour une visualisation facile plus tard. Pour fabriquer des produits, il faut encore regarder les octets.

La deuxième catégorie de plug-ins de navigateur d'IA est celle des produits « shell » basés sur des modèles existants, dont Monica est la représentante.

Il s'agit d'un plug-in basé sur de grands modèles tels que GPT-4o et Claude 3.5, et supporte les moteurs de recherche tels que Google et Bing.

Nous pouvons lui parler et le laisser rechercher, écrire, traduire et interpréter le texte sélectionné, résumer des PDF, des pages Web, des e-mails, des vidéos YouTube…

En bref, un assistant d'IA complet capable de discuter, de rechercher, de traduire et de résumer, de connecter un certain nombre de produits d'IA avec des plug-ins et de réaliser une expérience « tout-en-un ».

Cependant, par rapport aux plug-ins gratuits Kimi et Doubao, Monica a une limite de quota et nécessite un abonnement pour débloquer plus de fonctionnalités. Au mieux, cela coûte moins cher que de souscrire séparément à plusieurs produits d’IA.

Il existe également un type de plug-in de navigateur IA qui prend racine dans la voie verticale et répond aux besoins des petits et des beaux. Du point de vue de nos éditeurs technologiques, il en existe deux couramment utilisés.

Le premier est Tongyi Listening, qui réalise la conversion parole-texte sur diverses pages Web et prend en charge les sous-titres bilingues en temps réel. Après l'enregistrement, vous pouvez résumer le contenu et extraire les points clés, ce qui est très approprié pour les conférences de presse suivantes.

La seconde est la traduction immersive, qui réalise la traduction bilingue de diverses pages Web, vidéos et même de PDF. Contrairement à Google Translate, qui couvre le texte original, l'expérience de navigation est meilleure et il est plus pratique de vérifier les informations.

Dans le même temps, Immersive Translation a lancé une fonction de traduction experte pour différents scénarios tels que les sites Web de jeux et les réseaux sociaux – essentiellement une série de mots d'invite soigneusement conçus. Nous n'avons pas besoin de copier le texte sur ChatGPT, nous écrivons nos propres mots d'invite et laissons l'IA le traduire pour nous avec un certain ton et une certaine identité.

L'équipe Kimi affirme que le plug-in Kimi est comme une « recherche légère » qui vous aide à résoudre de petits problèmes de fragmentation. Cette phrase s'applique également au formulaire de plug-in de navigateur d'autres produits d'IA. Les plug-ins sont une tentative légère d’implémenter l’IA.

Peu importe que vous lisiez, écriviez ou regardiez des vidéos, quelle que soit la page Web que vous ouvrez, une ou plusieurs d'entre elles peuvent jouer un rôle de soutien dans les activités mentales humaines, compensant les détails et les imperfections inconfortables de la navigation sur Internet antérieure.

Les plug-ins avec un sentiment de présence trop fort peuvent parfois être une distraction.

Cependant, tout comme le grand modèle de l'année dernière et la recherche d'IA au premier semestre de cette année, la concurrence entre les plug-ins est également féroce, il y a des fonctions qui se chevauchent et même des combats ont commencé.

Après avoir été ajoutés à la barre d'outils, les plug-ins d'IA ont fondamentalement une forte capacité de suivi et espèrent montrer leur présence devant les utilisateurs.

Ils sont à portée de main et peuvent être invoqués avec des touches de raccourci. Ils apparaissent sous forme de boutons flottants dans le coin de l'écran et sous forme de barres latérales sur le côté droit des pages Web. Ils se précipitent également pour sauter lorsque vous sélectionnez une phrase et que vous souhaitez la fournir. vous avec des services.

▲ Sélectionnez la phrase et Monica, Doubao et Kimi apparaîtront tous.

Cependant, ils peuvent aussi s'attarder. Que Kimi affiche un bouton flottant et que le bouton apparaisse après avoir sélectionné du texte est facultatif. Doubao et Monica prennent également en charge le masquage des boutons.

Plug-in d'IA généraliste axé sur la productivité, il dispose de fonctionnalités larges et complètes et répond essentiellement aux besoins suivants : soulignement d'explication, création assistée, synthèse de contenu…

Les principaux besoins des utilisateurs pour surfer sur Internet ne sont peut-être que ces quelques-uns. S'ils sont satisfaits par plusieurs plug-ins d'IA en même temps, il vous sera difficile de choisir. Parmi eux, Doubao et Monica sont particulièrement susceptibles de se croiser.

Regardez des vidéos YouTube, Doubao et Monica vous aideront à résumer les moments forts et la chronologie.

Lorsqu'ils utilisent Google pour des recherches traditionnelles, Doubao et Monica répondront aux questions sur le côté droit de la page de résultats. Par exemple, si vous recherchez sur Google « Introduction à Doubao », Doubao se présente et Monica présente un mets délicat appelé Doubao.

Cependant, Doubao a une fonction de plus que Monica : si vous sélectionnez un lien avec la souris mais ne cliquez pas dessus, Doubao résumera également le contenu pour vous, et vous pourrez ensuite ouvrir le lien pour voir les détails.

Quant à la création auxiliaire, elle est encore plus exagérée. Dans presque toutes les zones de saisie, y compris ChatGPT, Weibo et Douban, le « point violet » de Monica apparaîtra.

Après avoir cliqué dessus, vous verrez "Assistant d'écriture". L'IA vous demandera si vous devez écrire quelque chose, qu'il s'agisse d'une lettre de motivation ou d'un e-mail. Une fois le contenu généré, vous pourrez l'insérer directement dans. la zone de saisie.

De même, Doubao dispose également d'une fonction « Écrire pour moi ». Entrez un sujet et vous aidez à générer du contenu dans les styles de Xiaohongshu, Douyin, etc., puis insérez-le dans la zone de saisie en un seul clic.

Les anciens disaient que partout où il y avait un endroit pour boire au puits, on pouvait chanter Liu Ci. Désormais, cette phrase peut avoir une version Internet : tout espace vide où la rédaction doit être générée peut être laissé avec un chef-d'œuvre généré par l'IA.

Mais peut-être souhaitons-nous simplement rédiger une plainte nous-mêmes ou discuter avec ChatGPT. À ce stade, l'icône semble un peu intrusive et nécessite que vous la fermiez manuellement.

Ces plug-ins très performants sont un peu la mascotte de Microsoft « Big Eye Clip » qui servait à apprendre aux nouveaux utilisateurs à utiliser Office vers 2000. À ce moment-là, lorsque vous créiez un nouveau document ou tapiez « Cher » pour écrire une lettre, le dossier Big Eye apparaissait soudainement sans aucune explication.

Le problème avec les big eye clips est qu'ils ne peuvent pas beaucoup aider. Ils ont perdu leur emploi après le lancement d'Office XP. Microsoft estime que le produit lui-même est simple et facile à utiliser.

Le problème avec les plug-ins est qu'ils sont utiles, mais leurs fonctions sont similaires. S'ils ne sont pas strictement nécessaires, ils sembleront parfois « intrusifs ».

Comme auparavant, j'ai demandé à un collègue s'il pouvait me recommander un plug-in utile pour la traduction YouTube. Il ne pouvait pas donner de réponse pour le moment, car il y avait trop de plug-ins similaires, et il les oublierait s'il ne les épinglait pas sur la barre d'outils.

L’IA est devenue l’entrée de l’information et les navigateurs sont disponibles partout où vous ne savez pas comment cliquer.

Il existe déjà une prolifération de plug-ins dérivés pour les produits d'IA. Dans le même temps, il existe également des plug-ins tiers qui servent les produits d'IA.

L'un d'eux est le plug-in Google AI Home Tab. La fonction est très simple, mais le concept est très intéressant.

Il peut définir votre site Web principal d'IA préféré comme page d'accueil du navigateur, et vous pouvez également le rétablir sur la page d'accueil par défaut.

La fonction principale de ce plug-in est en réalité de changer subtilement nos habitudes en ligne.

Afin de devenir le moteur de recherche par défaut de Safari, Google paie chaque année une somme énorme à Apple. On peut voir que la « valeur par défaut » est aussi puissante que la gravité dans le développement des habitudes des utilisateurs.

Si notre portail d'information devient directement divers outils de recherche d'IA, peut-être nous habituerons-nous de plus en plus, et deviendrons-nous meilleurs, à communiquer avec l'IA via le champ de recherche pour obtenir des réponses, au lieu de saisir l'URL dans Google pour trouver la recherche d'IA.

Cependant, il faut quand même se méfier de l’illusion de l’IA, et un plug-in appelé SeekAll est né à cet effet.

Il s'agit d'un assistant multi-écran de navigateur qui prend en charge l'ouverture de plusieurs moteurs de recherche en un seul clic et la comparaison des résultats de recherche. Il prend en charge à la fois la recherche AI ​​et la recherche traditionnelle. Actuellement, il prend en charge jusqu'à trois recherches en même temps.

Avec plus de plug-ins et des entrées plus directes, à l'avenir, notre expérience en ligne pourrait vraiment devenir « ne cliquer nulle part ».

Que signifie ce terme technique ? Comment optimiser les phrases de ce document ? Ce sous-titre YouTube peut-il être retranscrit en texte ? Vous pouvez attendre que l’IA intervienne et vous aide à répondre. Le plug-in Beanbag peut même résumer le podcast Little Universe récemment.

À l’inverse, du point de vue d’une startup d’IA, développer des plug-ins, c’est un peu comme traverser une rivière à la recherche des pierres. Bien que les produits d'IA apparaissent sans cesse, ils recherchent toujours des scénarios plus segmentés, accumulant davantage de données utilisateur et formant des modèles plus puissants.

Les navigateurs sont un outil essentiel pour surfer sur Internet. Pour explorer les besoins à haute fréquence des utilisateurs qui peuvent être satisfaits par l'IA, les plug-ins de navigateur qui peuvent être intégrés de manière flexible dans les pages Web peuvent constituer une forme de test idéale.

Ne fixez pas de limites d’abord, puis voyez plus de possibilités.

À l’avenir, il n’existe pas de définition claire de ce à quoi ressemblera l’interface utilisateur lors de la navigation sur Internet ni de la manière dont nous interagirons avec l’IA. Mais de petites étapes et des itérations rapides de plug-ins nous rapprochent d'un navigateur compatible AIGC.

Elle est aussi vive que le gel d’automne et peut conjurer les désastres maléfiques. E-mail professionnel : [email protected]

# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo