L’IA est en plein essor depuis deux ans et la technologie progresse rapidement. Le grand modèle a-t-il surmonté le dilemme de la commercialisation ?
Depuis l’émergence de ChatGPT, l’engouement pour l’IA prend de l’ampleur depuis deux ans. Au cours des deux dernières années, les gens ordinaires ont été enthousiasmés par les capacités des grands modèles de langage, capables de générer un texte fluide et naturel avec une seule instruction. Les scènes de films de science-fiction sont désormais devenues une réalité.
La piste des grands modèles a également commencé à entrer dans un carrefour : comment transformer les nouvelles technologies en nouveaux produits, répondre aux besoins réels et se développer en un nouvel écosystème commercial.
Tout comme les paiements mobiles, les smartphones et le LTE ont conjointement déclenché la prospérité de l'ère de l'Internet mobile, l'industrie de l'IA recherche également avec impatience un tel PMF (Product Market Fit) cette année.
Le grand voyage des nouvelles technologies a commencé. La découverte d’un nouveau continent déterminera si le Big Model est un autre jeu de capital brûlant de l’argent, une récurrence accélérée de la bulle .com ou le début d’une nouvelle révolution industrielle, comme l’a dit Huang Renxun. . La réponse nous sera disponible plus rapidement que l'AGI.
Gros problèmes avec les gros modèles
Aujourd'hui, la concurrence entre les modèles de base forme essentiellement un modèle stable. Mené par OpenAI, son ChatGPT est également leader du marché. Anthropic, DeepMind, Llama et Grok ont également leurs propres atouts.
Par conséquent, la chose la plus excitante cette année n'est pas combien de paramètres supplémentaires ont été étendus ou combien de secondes la vitesse de réponse a été améliorée, mais comment la technologie des grands modèles a été transformée en un produit utilisable.
Comment implémenter la technologie des grands modèles de langage a été un problème depuis le début. La Harvard Business Review a déjà mené une enquête et a découvert qu'il existe jusqu'à 100 types d'applications d'IA générative.
Cependant, il existe cinq grandes catégories : résolution de problèmes techniques, production et édition de contenu, support client, apprentissage et éducation, création artistique et recherche.
La célèbre société d'investissement a16z a présenté dans l'esprit de son équipe les excellents produits d'IA générative, dont beaucoup sont familiers, comme les produits à usage général Perplexity, Claude et ChatGPT. Il en existe également des plus verticaux, comme les produits de prise de notes Granola, Wispr Flow, Every Inc., Cubby, etc. Il y a aussi NotebookLM, le plus grand gagnant de cette année dans le volet éducation, ou encore les chatbots Character.ai, Replika, etc.
Blooming Flowers est destiné aux utilisateurs ordinaires : la plupart des produits ci-dessus sont gratuits et suffisants. Le coût de la version par abonnement ou de la version pro n'est pas nécessaire. Aussi fort que ChatGPT, les revenus d'abonnement de cette année s'élèvent à environ 283 millions de dollars par mois, soit trois fois plus que l'année dernière. Mais face aux coûts énormes, ces revenus semblent être une goutte d’eau dans l’océan.
Profiter du développement de la science et de la technologie est une chose heureuse pour les utilisateurs ordinaires, tandis que l'huile de cuisson sous le feu est laissée aux praticiens : aussi passionnante que soit l'évolution technologique, elle ne peut pas rester en laboratoire, mais doit entrer dans la société commerciale pour être testée. . Le modèle d’abonnement n’a pas été largement accepté et l’heure de la publicité n’est pas encore venue. Il reste très peu de temps pour gaspiller de l'argent sur de grands modèles.
En revanche, la tendance des activités toB est beaucoup plus confiante.
Le nombre de mentions de l’IA dans les appels à résultats Fortune 500 a presque doublé depuis 2018. L'IA générative était le principal sujet mentionné dans 19,7 % de tous les appels sur les résultats.
C'est aussi le consensus de l'ensemble de l'industrie. Selon le livre bleu « Artificial Intelligence Development Report (2024) » publié par l'Académie chinoise des technologies de l'information et des communications, en 2026, plus de 80 % des entreprises utiliseront des API d'intelligence artificielle générative ou déploieront des applications génératives.
Les applications destinées aux entreprises et aux consommateurs présentent des tendances de développement différentes : Du côté des consommateurs, les applications à grande échelle se concentrent sur un seuil bas et la créativité. Du côté des entreprises, les applications de grands modèles accordent davantage d'attention à la personnalisation professionnelle et aux commentaires sur les avantages.
En d 'autres termes, l' amélioration de l 'efficacité est bien entendu ce que chaque entreprise recherche et souhaite réaliser, mais ces quatre mots sont trop vagues. Les grands modèles doivent prouver qu’ils peuvent réellement résoudre les problèmes dans des scénarios d’utilisation et améliorer véritablement l’efficacité.
Trouvez avec précision l'angle de coupe et laissez tomber la technologie
Qu'il s'agisse de l'investissement en ressources ou de l'intensité du développement du marché, la concurrence nationale pour les grands modèles sera féroce tout au long de 2024.
Selon les données du ministère de l'Industrie et des Technologies de l'information, le taux de croissance du grand marché chinois des modèles linguistiques dépassera 100 % en 2023, la taille du marché atteignant 14,7 milliards de yuans. Divers fabricants s'engagent activement dans le processus de commercialisation. La première chose à faire est la guerre des prix : les coûts de facturation des jetons, des appels API, etc. sont continuellement réduits. Les prix de nombreux grands modèles grand public et populaires à usage général ne sont plus loin d’être inutiles.
Il vaut mieux baisser les prix et réduire les coûts. Comprendre l’entreprise et analyser les scénarios est un parcours plus difficile.
Cependant, toutes les entreprises ne participent pas à une guerre des prix et ne comptent pas sur des prix bas pour gagner.
« Dans ce cas, il est plus important de trouver nos caractéristiques et de tirer pleinement parti de nos avantages. Il existe de nombreux scénarios au sein de Tencent lui-même, qui nous donnent plus d'informations et perfectionnent davantage nos capacités. » Zhao Xinyu, chef de produit ToB, pense ainsi : « Regardez à l'extérieur, concentrez-vous sur une industrie, concentrez-vous sur certains scénarios spécifiques de cette industrie, puis développez-vous lentement.
Parmi les nombreux modèles de base, le Hunyuan n'est peut-être pas le plus populaire, mais sa solidité technique ne peut être ignorée.
En septembre, Hunyuan a publié le modèle de littérature générale Hunyuan Turbo, qui adopte un nouveau modèle hybride de structure d'experts (MoE). De la compréhension et de la génération du langage, au raisonnement logique, à la reconnaissance d'intention, à l'encodage, aux tâches de contexte longues et d'agrégation, il offre de très bonnes performances. Dans la version de mise à jour dynamique de novembre, il a été mis à niveau vers le modèle le plus performant de toute la série. Actuellement, les capacités de Tencent Hunyuan sont entièrement exportées via Tencent Cloud. En fournissant des modèles multi-tailles et multi-types, combinés avec d'autres produits d'IA et capacités de Tencent Cloud Intelligence, il aide à modéliser les applications à mettre en œuvre dans des scénarios.
En regardant les formes actuelles de mise en œuvre des applications modèles, elles peuvent être grossièrement divisées en deux types : les scènes sérieuses et les scènes de divertissement. Ce dernier s’apparente aux chatbots, aux applications compagnons, etc.
Les « scénarios sérieux » font référence à des scénarios d'application qui nécessitent une plus grande précision et fiabilité dans les opérations commerciales de base des entreprises. Dans ces scénarios, les grands modèles sont responsables du traitement structuré des informations et doivent souvent suivre des processus métier et des normes de qualité prédéfinis. Leurs effets d'application seront directement liés à l'efficacité opérationnelle et aux résultats commerciaux de l'entreprise.
Tencent Cloud a déjà aidé un fournisseur de services d'appels sortants à créer un système de service client . C'est un scénario sérieux typique. Dans le même temps, les appels sortants impliquent des capacités de dialogue en langage naturel, des capacités de compréhension et d'analyse du contenu, et il semble que le langage naturel ait un haut degré d'adaptabilité aux grands modèles de langage.
En fait, le défi réside dans les détails. À cette époque, l’équipe était confrontée à deux défis majeurs. Le premier concerne les problèmes de performances. En raison de l'énorme quantité de paramètres du modèle, atteignant une échelle de 70B ou 300B, comment compléter la réponse en 500 millisecondes et la transmettre au système TTS en aval est devenu un problème technique important.
La seconde est l’exactitude de la logique du dialogue. Le modèle affichera des réponses illogiques dans certaines conversations, affectant l'effet global de la conversation. Afin de surmonter ces défis, l'équipe du projet a adopté une stratégie d'itération intensive et a maintenu un rythme d'itération rapide d'une version par semaine sur un cycle de développement de 1 à 2 mois.
Les entreprises clientes ont manifesté leur intérêt pour la technologie des grands modèles de langage et sont prêtes à faire des tentatives innovantes. Cependant, il existe toujours un écart cognitif dans l'intégration profonde de la technologie et des affaires. Cela n'est pas dû au manque de compréhension de l'entreprise de sa propre activité, mais à la nécessité d'une équipe technique professionnelle pour trouver les scénarios les plus appropriés grâce à une compréhension approfondie des problèmes du secteur et des scénarios commerciaux, des solutions de mise en œuvre de l'IA sur mesure pour le entreprise, et atteindre la technologie et la meilleure solution pour l'entreprise.
"L'approche traditionnelle peut exiger que les opérateurs construisent des (corpus) scène par scène", a déclaré Xinyu. "Avec les grands modèles, il vous suffit de donner une invite pour réaliser les exigences, Hunyuan L'équipe met à jour la version." presque chaque semaine, ce qui accélère l'itération. Au bout d'un mois ou deux, la précision atteint 95 %.
Pour ce service d’appels sortants, la technologie générative est complètement nouvelle. Hunyuan leur a directement permis de constater les avantages apportés par les grands modèles, réduisant les dépenses de main d'œuvre des trois quarts.
"La meilleure façon est de montrer les effets", a déclaré Xinyu. Lorsque le client comprend peu mais pas beaucoup la technologie générative, il est plus efficace de montrer les effets. Grâce à l'expérience commerciale du client, nous pouvons trouver des scénarios qui peuvent être découpés, effectuer des tests et des vérifications directs et démontrer les effets qui peuvent être améliorés.
Une expérience similaire, reflétée dans la coopération avec Xiaomi, est une coopération appelée « ruée vers les deux sens ».
L'autre partie espère introduire de grands modèles dans les interactions questions-réponses et appliquer les capacités de recherche de l'IA du côté du terminal. Cela touche deux des points forts de Hunyuan : premièrement, le support fourni par le riche écosystème de contenu de Tencent, deuxièmement, les capacités de Hunyuan en matière de recherche par IA ; Pour les questions et réponses, l’exactitude est très critique.
« Il y avait encore de nombreuses difficultés au début », se souvient Xinyu. « De leur point de vue, le formulaire commercial couvre plusieurs scénarios, y compris les bavardages, les questions-réponses sur les connaissances et d'autres types différents. Parmi eux, le scénario de questions-réponses sur les connaissances a un taux de précision relativement élevé. . Exiger."
Grâce à des tests préliminaires, l'équipe Hunyuan a clarifié ses avantages dans le scénario de recherche. Les deux parties ont travaillé ensemble pour affiner progressivement l'interaction questions-réponses au sens large en fonction des différents niveaux de sujets. Ce type de subdivision peut permettre au modèle de comprendre plus clairement les besoins spécifiques et les exigences d'effet de chaque scène, afin de réaliser une optimisation plus ciblée.
La scène de quiz est devenue ce point d’atterrissage. En termes de mise en œuvre ultérieure, Hunyuan a encore de nombreux défis à relever : Inutile de dire que le problème des retards, le temps de réponse doit être rapide, et deuxièmement, l'intégration du contenu de recherche ;
"Dans l'ensemble du lien, nous avons construit un moteur de recherche auto-construit et un modèle de classification d'intention pour déterminer s'il s'agit d'une question très sensible au facteur temps. Par exemple, s'il s'agit d'un sujet lié à l'actualité ou à l'actualité, puis déterminer s'il s'agit d'une question à laquelle il faut répondre. Au modèle principal ou à la recherche AI.
Seules les pièces les plus nécessaires sont appelées, ce qui permet d'améliorer considérablement la vitesse de réponse. Une conclusion importante est que 70 % des demandes seront dirigées vers la recherche par l'IA, ce qui signifie qu'il doit y avoir suffisamment de contenu riche comme support d'appel le plus élémentaire.
Derrière Hunyuan se trouve tout l’écosystème de contenu de Tencent. Qu'il s'agisse d'actualités, de musique, de finance ou encore de domaines plus spécifiques tels que les soins médicaux, vous pouvez trouver une grande quantité de contenu de haute qualité dans l'écosystème de Tencent. Ce sont les données auxquelles le modèle hybride peut accéder et référencer lors de la recherche, et elles constituent également des barrières uniques.
Après plus de deux mois d'itérations intensives, les exigences ont finalement été pleinement satisfaites en termes de qualité de réponse, de réponse et de performances, et elles ont été lancées dans les activités réelles de Xiaomi.
C'est l'essence même de l'activité de ToB. Pour pouvoir générer des revenus et gagner la confiance, elle doit réellement apporter de la valeur à l'activité du client.
Ce n'est qu'en généralisant le « volume » que l'on pourra évoluer vers davantage de scénarios
La mise en œuvre de grands modèles dans différentes industries et produits favorise en fait la croissance de la technologie elle-même.
Pour certains produits de grand modèle, le choix de la voie ToC doit être pris en compte : utiliser les commentaires du côté C pour optimiser le modèle. Les grands modèles ont une demande sans fin de réglage, et le nombre et l'activité des groupes de consommateurs de l'extrémité C nourrissent les itérations du modèle. De cette façon, le volant itératif peut commencer à fonctionner.
En fait, cela peut également être réalisé dans le secteur toB, et les exigences sont encore plus élevées.
La fonction de correction de la composition chinoise K12 de « Youth Get » applique les capacités multimodales de Hunyuan. En combinaison avec la technologie OCR de Tencent Cloud Intelligence, le contenu des compositions des étudiants est identifié et la composition est notée par un grand modèle selon les normes de notation établies.
Habituellement, si la différence entre le grand modèle et le véritable enseignant se situe à moins de cinq points, c'est bien – mais ce n'est pas facile à réaliser. Au début, la différence entre la note de Hunyuan et celle du véritable professeur était inférieure à cinq points seulement dans 80 % des cas.
"Le modèle dispose de certaines méthodes et capacités et peut résoudre des problèmes dans certains scénarios. Mais se concentrer sur l'activité d'un client spécifique a des exigences plus élevées pour cet effet . " Xinyu a déclaré : " Peut-être qu'une précision de 90 % peut atteindre les objectifs commerciaux. , mais seulement 70 % et Dans 80 % des cas, il y a une certaine distance.
Cela signifie que nous devons continuer à « rouler ». À mesure que la clientèle des entreprises de services continue de croître, de nouvelles exigences sont également avancées pour la technologie elle-même : premièrement, la vitesse d'itération est considérablement améliorée – face aux utilisateurs finaux C, l'itération peut prendre un à deux mois. Désormais, une version peut apparaître chaque semaine. Ce rythme d'itération à haute fréquence a grandement favorisé la croissance et la progression du modèle.
Deuxièmement, en servant continuellement différents scénarios d'entreprise, la capacité de généralisation du modèle a également été considérablement améliorée. Cela montre qu'un service approfondi répondant aux besoins d'entreprises diversifiées accélère non seulement le rythme de développement et d'itération du modèle, mais améliore également le caractère pratique et l'adaptabilité du modèle, qui peut être étendu de scénarios sérieux à des scénarios axés sur le divertissement.
La plateforme de contenu de jeu de rôle « Dream Dimension » , qui vient de recevoir des dizaines de millions de financement de série A , a appliqué Hunyuan-role, un modèle de jeu de rôle exclusif du modèle Hunyuan. Il est positionné pour servir les jeunes utilisateurs et combine génératif. Technologie d'IA pour offrir une expérience interactive et dramatique de personnage virtuel.
Le rôle Hunyuan crée une nouvelle façon d’interagir homme-machine. En créant des images de personnages virtuels riches et diversifiées et en nous basant sur des arrière-plans d'intrigue et des paramètres de personnages prédéfinis, nous pouvons développer des dialogues interactifs naturels et fluides avec les utilisateurs.
Au niveau technique, de tels scénarios ont été appliqués au rôle Hunyuan, qui a montré des avantages majeurs dans le traitement des dialogues de textes longs et courts, la reconnaissance et la réponse des intentions, etc., est capable de divers scénarios d'application et a démontré d'excellentes capacités d'anthropomorphisme de contenu. —— Il permet non seulement un dialogue et une interaction chaleureux, mais favorise également le développement du scénario et crée une expérience utilisateur immersive.
Ces caractéristiques font de Hunyuan-role un outil puissant pour l'acquisition de clients de produits et les opérations d'utilisateurs, jouant un rôle important dans l'amélioration de la fidélisation des utilisateurs et de la pérennité de l'utilisation. Cela reflète également que la capacité de généralisation formée par Hunyuan, qui a été entraînée et améliorée dans des scènes sérieuses, peut couvrir un plus large éventail de scènes et même être appliquée du côté de l'appareil.
Des scènes sérieuses à l'expansion progressive du divertissement, de la créativité et encore plus de scènes, c'est un voyage dans lequel les applications de grands modèles doivent se lancer.
À mesure que la technologie évolue et que les coûts diminuent, les grands modèles sont appelés à s'étendre à un plus large éventail de scénarios d'application. Il s'est initialement concentré sur des scénarios commerciaux sérieux, tels que les sièges sociaux, l'analyse de données, la recherche scientifique et d'autres secteurs, car ces scénarios ont des besoins clairs et une forte volonté de payer.
Pour nous développer davantage dans les secteurs du divertissement, de la créativité, de la production de contenu et d'autres secteurs, nous devons avoir un point d'ancrage dans notre réflexion : toujours nous concentrer sur la résolution des points de demande dans des scénarios spécifiques comme objectif principal, et ancrer le point d'entrée pour l'intégration des capacités des grands modèles. .
En plus de la coopération avec les logiciels d'application, il est également nécessaire de coopérer avec les fabricants de matériel afin que le modèle puisse être affiché et utilisé du côté du terminal le plus proche des consommateurs, offrant ainsi une expérience de service plus pratique et instantanée, plus proche de la vie quotidienne des utilisateurs. .
Dans ce processus, la sensibilisation et l'acceptation par le marché de la technologie de l'IA générative s'améliorent constamment, et la base d'utilisateurs continue également de s'élargir. Face à cet environnement de marché en évolution rapide, la capacité à itérer les modèles est devenue particulièrement importante. Cela ne se reflète pas seulement dans les performances techniques, mais inclut également de multiples dimensions telles que la compréhension des besoins des utilisateurs et l'adaptabilité à différents scénarios. Seuls les modèles et les équipes capables d'apprendre rapidement, d'optimiser en permanence et de s'adapter en permanence aux nouveaux besoins peuvent conserver un avantage sur la concurrence.
À mesure qu’il continue de couvrir davantage de scénarios, il atteint également davantage de consommateurs finaux. À mesure que le marché dans son ensemble accepte la technologie générative, le nombre d’utilisateurs potentiels continuera d’augmenter. Seul un modèle capable d’itérer et de s’améliorer rapidement peut s’adapter avec enthousiasme aux changements et avancer plus régulièrement et plus loin.
# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.
Ai Faner | Lien original · Voir les commentaires · Sina Weibo