Nous avons besoin de plus d’applicateurs d’IA qui ne construisent pas de grands modèles

Tout en IA, d’ici 2024, ce nœud est presque devenu le thème principal des entreprises technologiques Internet.

Il semble que le monde entier soit tombé dans l'IA Fomo (phobie de l'IA de manquer quelque chose). Les entreprises technologiques ont lancé une course aux armements à grande échelle pour rattraper OpenAI. Les individus ordinaires craignent d'être remplacés par l'IA, donc l'IA à 199 yuans Bien sûr, il a gagné un grand nombre de fans.

Dans la « bataille de centaines de modèles » qui fait rage en Chine, Kingsoft Office est considéré comme une exception. Cette société, qui détient la plus grande part de marché nationale des logiciels de bureau et un flux de trésorerie abondant, n'a pas investi dans la concurrence des grands modèles, mais elle est la première en Chine à lancer l'assistant de bureau intelligent WPS AI basé sur de grands modèles de langage.

Hier, lors de la conférence sur la productivité de Kingsoft Office, le PDG Zhang Qingyuan a une fois de plus souligné que Kingsoft Office est un applicateur de grands modèles et qu'il est actuellement connecté à presque tous les grands modèles grand public en Chine.

De cette manière, Kingsoft Office, qui est All in AI, connaît le troisième nœud important après le passage de l'ère du PC à l'ère de l'Internet mobile au cours des 36 dernières années. Les deux premiers nœuds ont influencé la tendance du marché chinois des logiciels de bureau. .

Dans les années 1980, Qiu Bojun s'est enfermé pendant 14 mois dans la chambre 501 de l'hôtel Caiwuwei à Shenzhen, utilisant un ordinateur 386 pour taper 120 000 lignes de code assembleur. En 1988, WPS 1.0 était né.

En 2002, Lei Jun, employé n°6 de Kingsoft, a amené plus de 100 ingénieurs à passer trois ans à réécrire plus de 5 millions de lignes de code WPS et à lancer WPS 2005, entièrement compatible avec Microsoft Office.

▲ Lei Jun (à gauche) et Qiu Bojun

Aujourd'hui, l'arrivée des grands modèles a commencé à changer la façon dont les applications logicielles sont utilisées et développées. Zhang Qingyuan estime que même le mot UI (User Interface) disparaîtra à l'avenir. Kingsoft a également suspendu toutes les activités non liées à l'IA depuis l'année dernière et s'est lancé dans une transformation globale.

Ifaner a prédit dans l'ifanRank du début de l'année que nous nous dirigeons vers « l'ère des grandes applications » de l'instrumentalité, de l'universalisation et de l'industrialisation. En 2024, nous verrons davantage d'applications natives d'IA répondant aux besoins des consommateurs ou des entreprises.

Le secteur des grands modèles devient progressivement saturé et nous avons évidemment besoin de plus d’entreprises qui se concentrent sur la mise en œuvre de produits d’IA pour transformer les capacités des grands modèles en productivité et créativité industrielles.

Le mythe de la productivité de l'IA

En regardant les outils d'IA populaires de l'année dernière, qu'il s'agisse de Copilot de Microsoft ou de Sora, qui ont commencé à apparaître à l'écran pendant la Fête du Printemps, deux mots très fréquents apparaissent souvent à leurs côtés : subversion et remplacement.

Bien que ces outils d'IA soient conçus pour améliorer la productivité, par rapport aux gains d'efficacité qu'ils peuvent apporter, le nombre d'emplois pouvant être remplacés et les secteurs qui seront perturbés reste toujours le sujet le plus discuté. De nombreuses organisations sont même disposées à calculer le pourcentage précis.

Quelle est la nature de l'outil ? Aidez-nous à accomplir plus facilement ce que nous voulons faire. Il existe deux manières d'améliorer la productivité : soit pour améliorer l'efficacité d'une seule étape, soit pour réduire le nombre d'étapes requises dans le processus de tâche, soit pour réaliser les deux en même temps.

Un certain nombre d’outils d’IA pilotés par de grands modèles ont considérablement raccourci le processus allant de la proposition d’exigences à la réalisation des idées.

Vous prononcez simplement une phrase, laissez l'IA la décrire en quelques secondes, puis générez plus de 20 pages de PPT.

Certaines vidéos qui nécessitaient auparavant un tournage et une post-production sont désormais transformées en commande d'invite.

Même s'il s'agit d'une photo occasionnelle prise avec un téléphone portable, les passants ou les débris peuvent être éliminés en l'entourant avec votre doigt.

Zhang Qingyuan a prédit dans une interview l'année dernière que dans environ un an, les gens pourront utiliser « 100 yuans par mois pour embaucher un assistant Office polyvalent » afin d'acquérir un nouveau contrôle sur les logiciels de bureau, y compris les formulaires, tableaux et calculs complexes. Les barres d'outils vont toutes disparaître des logiciels bureautiques. Cette méthode "d'abonnement" va changer fondamentalement le modèle économique des logiciels bureautiques.

Derrière cela se cache en réalité le fait que l’IA a accéléré le processus de démocratisation de la puissance de calcul.

Fu Zihao, chef de produit de WPS AI, a fait un constat dans un partage il n'y a pas si longtemps : L'émergence des grands modèles n'est pas comparable à l'émergence de l'Internet mobile, elle ressemble plutôt à l'ère de la naissance du PC et de la naissance du nuage.

À mesure que les besoins et les scénarios émergents dans la société humaine deviennent de plus en plus complexes, la puissance de calcul du cerveau n'est plus suffisante et nous commençons à accroître la puissance de calcul grâce aux ordinateurs. Mais le seuil pour libérer pleinement la puissance de calcul d'un ordinateur n'est pas bas. Vous devrez peut-être connaître les langages de programmation. Même les tableaux Excel et PS couramment utilisés ne sont pas faciles à utiliser correctement.

AIGC résout le problème du seuil de puissance de calcul : tant que vous utilisez le langage naturel, l'ordinateur peut comprendre votre logique de pensée et générer des résultats, raccourcissant considérablement la chaîne de l'idée au résultat.

Si vous comprenez cette logique, votre réponse à la récente interview de Sam Altman sur le nombre d’emplois que l’IA remplacera sera peut-être plus pertinente. La façon dont Altman y pense n'est pas le pourcentage du travail que l'IA effectuera, mais le pourcentage de la tâche que l'IA effectuera sur une période de temps.

Je pense que c'est une question plus intéressante, plus percutante et plus importante que la quantité de travail que l'IA peut accomplir, car c'est un outil qui peut fonctionner à des niveaux de plus en plus complexes, sur des échelles de temps de plus en plus longues. Accomplir de plus en plus de tâches et permettre aux gens d'opérer. de manière plus flexible. Alors peut-être que les gens seront plus productifs.

Cette réflexion est non seulement précieuse pour les utilisateurs, mais aussi pour les développeurs d’outils d’IA. Car ce dont les utilisateurs ont réellement besoin, ce ne sont pas de modèles avec des paramètres de plus en plus grands, mais d’outils qui leur facilitent la mise en œuvre de leurs idées, à l’image d’une réponse classique de Steve Jobs :

Nous devons commencer par l'expérience utilisateur, puis revenir au développement de la technologie, au lieu de commencer par la technologie, puis essayer de réfléchir à des moyens de voir où cette technologie peut être utilisée ?

Interaction copilote

Dans l'article « La première année du grand modèle, le système d'exploitation de la civilisation humaine subit une mise à jour majeure », nous avons mentionné que la prochaine génération de modes d'interaction homme-machine révolutionnaire pourrait être l'interface utilisateur naturelle (NUI).

Le principe fondamental de NUI est la simplicité avant tout. La complexité est l’ennemie des interfaces utilisateur naturelles. Chaque interaction doit être explicite et ne nécessiter aucun manuel d’instructions.

Copilot est la forme idéale d'outil d'IA dans la logique interactive NUI. Le mot copilote est dérivé du terme aéronautique et fait référence au copilote qui assiste le pilote principal dans le fonctionnement de l'avion. Lorsque le pilote principal a besoin de se reposer ou d'effectuer d'autres tâches, le copilote prend le contrôle. Les deux sont conjointement responsable du vol en toute sécurité de l’avion.

Je pense que c’est aussi la description la plus appropriée de l’interaction homme-IA. Microsoft définit Copilot comme : une application ou un composant qui utilise une technologie de traitement du langage naturel ou de grands modèles de langage pour aider les utilisateurs à accomplir des tâches complexes ou cognitives.

WPS AI considère également l'interaction homme-machine comme l'une de ses trois orientations stratégiques. Elle appelle également Copilot, une interaction naturelle basée sur plusieurs séries de questions et réponses basées sur le langage naturel, qui peut être profondément intégrée dans divers scénarios de documents et de collaboration.

Par exemple, l'édition WPS AI Enterprise lancée hier peut fournir aux employés des services numériques « à la fois en arts libéraux et en sciences », tels que des assistants de lecture, des assistants de dessin, des assistants de présence, des analyses des ventes, des analyses de contrats, etc., atteignant divers scénarios de bureau subtils.

Parmi eux, Copilot Pro peut aider les opérateurs à utiliser le langage naturel pour piloter les produits BI afin d'analyser les données, et peut également appeler l'API WPS 365 et l'API appartenant à l'entreprise pour répondre aux besoins de bureautique.

Les données GitHub montrent que 88 % des développeurs qui utilisent GitHub Copilot déclarent qu'ils sont plus productifs, 74 % déclarent qu'ils peuvent se concentrer sur un travail plus satisfaisant et 77 % déclarent que cela les a aidés à réduire le temps qu'ils passent à rechercher des informations ou des exemples.

Zhang Qingyuan a une description très appropriée : l'interaction en langage naturel réduit considérablement les coûts d'interaction des utilisateurs, ce qui signifie que Photoshop peut entrer directement sur le marché d'outils tels que « Meitu Xiu Xiu ».

Les utilisateurs peuvent réaliser des fonctions complexes dans Photoshop grâce à la difficulté interactive d'utiliser Meitu Xiuxiu. Cette situation se produit dans de plus en plus de types de produits d’IA. Si vous prêtez attention aux mises à jour de WPS AI de l'année dernière, vous constaterez également que l'interface utilisateur est constamment simplifiée et que la saisie en langage naturel commence à remplacer les fonctions de certains boutons d'origine.

On peut constater que la suite bureautique actuelle de traitement des documents s'est transformée en un bureau d'IA unique composé de « bureau + collaboration + IA ». Un produit peut accomplir efficacement de plus en plus de tâches, mais intègre de moins en moins de modules fonctionnels. Ce sera également la tendance des outils d’IA.

L'innovation technologique est essentiellement l'évolution de l'interaction homme-machine. Lorsque Copilot se développera dans une certaine mesure, l'ensemble de l'interface interactive pourrait même devenir une super application. Non seulement les boutons de fonction seront supprimés, mais de nombreuses applications elles-mêmes pourraient ne plus avoir besoin de le faire. exister seul.

Nous avons besoin de plus d’entreprises d’IA qui ne fabriquent pas de grands modèles

Beaucoup de gens considèrent les grands modèles ou l'AIGC comme la quatrième révolution industrielle. En fait, si une technologie doit être qualifiée de révolutionnaire, cela ne fait pas référence à la percée technologique elle-même, mais à sa capacité à affecter l'ensemble de la société des affaires et à changer la plupart des choses. les gens.

Qu’il s’agisse de vapeur, d’électricité ou d’Internet, il ne fait aucun doute qu’il répond à ces caractéristiques, mais qu’en est-il du grand modèle ? Au moins à ce stade, il n’est absolument pas possible d’atteindre ce niveau. Ce dont nous avons besoin, c'est d'exploiter les capacités des grands modèles grâce à des produits d'application d'IA pour avoir un impact sur le travail et la vie des gens.

▲ Ng Enda

L'informaticien Andrew Ng estime également qu'en tant que nouvelle génération de technologie à usage général, l'IA a plus de possibilités d'application à grande échelle .

C’est pourquoi j’ai dit dès le début que nous avions besoin de plus d’entreprises d’IA qui ne fabriquent pas de modèles. Les grands modèles sont indispensables en tant que technologie sous-jacente, mais les entreprises d'IA qui se concentrent sur la satisfaction des divers besoins des consommateurs et des diverses transactions commerciales ont certainement besoin de davantage pour faire véritablement exploser l'IA au niveau social.

Tout comme la technologie multi-touch, les applications matures existaient il y a plus de 20 ans, lors de la sortie de l'iPhone original, mais seul Apple a fait de cette technologie une solution interactive pour presque tous les smartphones ultérieurs.

Dans cette vague d'IA, il y a aussi des explorateurs qui ne produisent pas de grands modèles, mais sont déterminés à être de grands utilisateurs de modèles. Kingsoft Office est l'un des meilleurs.

La stratégie de Kingsoft Office est très pragmatique et se concentre sur des scénarios de mise en œuvre. Elle a atteint une coopération approfondie avec presque toutes les grandes sociétés nationales de grands modèles d'IA, notamment MiniMax, Zhipu AI, SenseTime, Wenxinyiyan, Tongyi Large Model, etc. .

Kingsoft joue le rôle d'une station de triage, chargée de déterminer tous les problèmes des utilisateurs et les scénarios à résoudre puis d'appeler le modèle le plus approprié pour effectuer la tâche. Certains scénarios de niche sont complétés par les petits modèles développés par Kingsoft Office pour répondre aux besoins.

Par exemple, SenseTime est excellent en analyse de données et WPS AI l'appelle pour gérer des scénarios qui nécessitent une réflexion scientifique. Les scènes telles que le texte et le PPT sont complétées grâce à des modèles tels que Zhipu AI.

L'avantage de cette méthode d'application consistant à diviser un grand modèle en plusieurs parties est qu'elle peut exploiter pleinement les atouts de chaque modèle et obtenir des avantages complémentaires sans être limitée par les capacités d'un certain modèle. Même GPT-4 présente des lacunes dans certains scénarios.

Lors de la conférence de presse WPS d'hier, Zhang Qingyuan a mentionné un point qui m'a profondément impressionné. Il a déclaré que toutes les fonctions qu'il a vues aujourd'hui peuvent être expérimentées immédiatement et doivent être mises en œuvre dans des scénarios d'application réels des clients.

En plus de l’involution continue du traitement de longs textes dans les boîtes de discussion, quelles autres applications plus imaginatives existe-t-il pour l’IA ? Cela mérite d'être exploré par davantage de personnes. Bien que les applications de grands modèles en soient actuellement à leurs balbutiements, il devrait y avoir davantage d'applicateurs d'IA comme Jinshan.

# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo