Byte lance la grande famille de modèles Doubao, qui peut générer trois exemplaires de « Romance des Trois Royaumes » pour un dollar, et le prix est 99 % moins cher que l’industrie

Que peut acheter un dollar ?

Lors de la conférence sur les forces motrices du printemps 2024 de Volcano Engine Force qui s'est tenue ce matin, le président de Volcano Engine, Tan Dai, a donné une réponse inattendue.

Un yuan peut acheter 1,25 million de jetons du modèle principal de Doubao, soit environ 2 millions de caractères chinois, ce qui équivaut à trois livres de « Le Roman des Trois Royaumes ».

La guerre des prix commence ! Byte lance un grand modèle de pouf

Les principaux défis liés à la mise en œuvre de scénarios de grands modèles résident dans les effets du modèle, les coûts d'inférence et les difficultés de mise en œuvre.

Afin d'aider les entreprises à résoudre ces défis et à utiliser de meilleurs modèles, des coûts réduits et des solutions plus faciles à mettre en œuvre pour aider les entreprises à réaliser la transformation de l'IA, Volcano Engine a officiellement lancé aujourd'hui une nouvelle génération de services d'IA full-stack.

Une bonne technologie doit être appliquée à grande échelle et continuellement perfectionnée avec un grand nombre d’appels.

Il y a un an, le modèle de pouf anciennement connu sous le nom de « Skylark » est devenu l'un des premiers grands modèles en Chine à être enregistré via l'algorithme.

Après un an de développement itératif, le grand modèle de Doubao traite actuellement 120 milliards de jetons de texte et génère plus de 30 millions d'images par jour.

À partir d'aujourd'hui, le modèle Doubao sera officiellement fourni au monde extérieur via le Volcano Engine.

La famille de modèles publiée cette fois comprend le modèle universel Doubao pro, le modèle universel lite, le modèle de jeu de rôle, le modèle de reconnaissance vocale, le modèle de synthèse vocale, le modèle de diagramme de Vincent et d'autres modèles.

Parmi eux, Beanbao Big Model Pro est le représentant le plus puissant du modèle beanbao. Il offre d'excellentes performances dans plusieurs dimensions telles que la compréhension de la logique de génération et de la mémoire. Il prend en charge 128 000 fenêtres contextuelles et peut aider les utilisateurs à comprendre rapidement un contenu textuel long et difficile.

Dans certains scénarios, pour les clients sensibles aux délais et aux coûts, le pouf universel modèle lite est un meilleur choix.

Grâce à la bénédiction des modèles de jeux de rôle, qu'il s'agisse de jouer le rôle d'un professeur de dialecte du Sichuan ou de promouvoir l'interprétation d'un scénario, la démonstration sur place est très simple.

La voix est une partie importante de l’interaction avec l’IA.

Les modèles de reconnaissance vocale et les modèles de synthèse vocale peuvent identifier avec précision le contenu, la langue et le contexte de l'utilisateur, et grâce à l'apprentissage du timbre, du ton et de l'intonation, les grands modèles peuvent exprimer de vraies émotions, permettant à l'IA de communiquer comme de vraies personnes.

Une utilisation importante peut peaufiner un bon modèle et réduire considérablement le coût unitaire de l'inférence du modèle. Le Volcano Engine s'est directement transformé aujourd'hui en « boucher de prix », apportant un choc d'un milliard de points sur le marché des grands modèles.

Le prix des modèles avec les mêmes spécifications sur le marché est généralement de 0,12 yuans/millier de jetons, tandis que le prix d'entrée d'inférence du modèle universel Pro-32k de Doubao n'est que de 0,0008 yuans/milliers de jetons, soit 99,3 % de moins que le prix de l'industrie.

Ou bien, le prix d'entrée du modèle général Doubao pro-128k est de 0,005 yuans/millier de jetons, soit 95,8 % de moins que le prix de l'industrie, réalisant véritablement une involution des prix « de centimes en centimes ».

En outre, afin d'aider les entreprises à mieux mettre en œuvre des applications de grands modèles, Tan Dai a également annoncé le lancement de la plate-forme Volcano Ark 2.0 et a publié trois plug-ins de grands modèles :

  • Plug-in de mise en réseau : recherchez des informations de données pertinentes à partir des données sur l'ensemble du réseau
  • Plug-in de contenu : fournissez un contenu vidéo et graphique riche
  • Plug-in de base de connaissances : prend en charge le réglage fin des données propriétaires pour réduire autant que possible les illusions de l'IA

Orienté application, la mise en œuvre est la voie à suivre

Grâce à une plateforme de développement IA native, nous avons la possibilité de faire de chacun un développeur d'applications IA.

Lors de la conférence de presse, Tan Daidi a formulé le jugement ci-dessus avec éloquence. En tant que plate-forme de création d'applications d'IA de nouvelle génération, les utilisateurs peuvent rapidement créer divers robots basés sur des modèles sur Button, qu'ils aient ou non des compétences en programmation.

De plus, les utilisateurs peuvent également publier des robots sur diverses plateformes sociales, logiciels de communication, ou les déployer sur d'autres canaux tels que des sites Web.

L'ouverture de la conférence de presse a présenté le robot IA d'un enfant de cinquième année. Il a utilisé les connaissances chinoises apprises à l'école pour créer un robot IA que l'on peut appeler un professeur étranger d'anglais.

Dans les environnements d'entreprise qui nécessitent des capacités de scénarios d'application plus élevées, Haidilao utilise des boutons pour simuler des exercices de dialogue avec les clients afin d'aider les dames du service client à améliorer les niveaux de service.

Super Orangutan utilise Kouzi pour aider les utilisateurs à comprendre une meilleure forme physique ; China Merchants Bank a créé un robot de réduction de vie mobile basé sur Kouzi qui recommande des restaurants dans des magasins discount et une perspective de richesse qui analyse les conditions du marché…

Le bot créé par Button prend en charge les interactions mixtes dans plusieurs modes tels que le texte, les images, la voix, la vidéo, les cartes GUI, etc. Les utilisateurs peuvent même communiquer avec le bot par la voix, tout comme discuter avec une personne réelle, et il répondra toujours de la même manière. de la manière la plus intelligente et la plus naturelle possible à chaque demande de l'utilisateur.

En outre, Huoshan Engine a également officiellement publié l'édition professionnelle Kouzi – selon les besoins des entreprises, Huoshe Engine est encapsulé sur la base de la plate-forme Kouzi et prend en charge de nombreuses fonctionnalités avancées.

Au cours des dix dernières années, ByteDance, qui comprend le mieux l'ère de l'Internet mobile, semble toujours être capable de créer un produit populaire et est progressivement devenu le géant qu'il est aujourd'hui.

La chose la plus impressionnante de cette conférence est la façon dont ByteDance comprend l'application et le développement de produits à l'ère des grands modèles.

Zhu Jun, vice-président des produits et de la stratégie, a déclaré qu'au lieu d'exécuter du code sur le serveur, il est plus important de créer des formes de produits appropriées et des méthodes d'interaction naturelles pour répondre aux besoins réels des utilisateurs et les inciter réellement à utiliser ces produits.

Lors de la conférence de presse, Zhu Jun a révélé l'origine du nom du pouf.

"Doubao", qui semble avoir peu à voir avec l'IA, est en fait le premier principe général qui a été déterminé lors de son premier nom : simplicité, facilité de lecture et facilité de mémorisation.

Dans le même temps, afin de réduire la distance entre le produit et l'utilisateur, ils ont défini en interne trois principes de conception de produits pour des produits tels que les poufs : personnification, proximité avec l'utilisateur, intégration dans l'environnement d'utilisation de l'utilisateur et personnalisation.

Au cours de la dernière année, ByteDance a fait beaucoup d'exploration sous la forme d'applications à grande échelle, et son plus grand sentiment est que par rapport à avant l'ère de l'IA, il existe à la fois des points communs et de grandes différences dans la création d'applications.

Alors, quel est le point commun ? Les besoins humains essentiels n’ont pas réellement changé. Par exemple, le besoin d'obtenir des informations rapidement et facilement n'a pas changé, et nous devons nous améliorer au travail…

Selon lui, il était relativement facile de créer des produits dans le passé, car au moins la technologie sous-jacente était mature et stable, il suffisait donc de faire preuve d'empathie et de réfléchir aux besoins des utilisateurs. modèles, c’était complètement différent.

La nouvelle difficulté n'est pas seulement de considérer ce que le grand modèle peut faire à ce moment-là, mais peut-être plus important encore, de deviner quels nouveaux scénarios d'utilisation pourront être mis en œuvre dans 3 mois, 6 mois ou deux ans.

Il s’agit donc d’un nouveau défi, et il est également nécessaire de prédire en permanence le PMF du prochain produit dans le cadre de l’évolution technologique dynamique.

Prenant l'exemple du moteur de recherche IA, Zhu Jun a révélé que lors de la tâche de recherche d'évaluation au cours du premier semestre de l'année dernière, il s'était souvent trompé sur 6 questions sur 10, ce qui signifie que le scénario d'application de recherche est complètement intenable. , avec l'évolution des capacités du modèle, les tâches de recherche d'IA sont désormais au moins utilisables aujourd'hui.

Cette transformation à partir de zéro, de la convivialité à l’optimisation, n’est pas seulement une avancée au niveau technique, mais aussi le résultat d’une connaissance approfondie des besoins des utilisateurs.

Selon un rapport de McKinsey, d'ici 2030, l'augmentation économique mondiale tirée par les grands modèles atteindra 49 000 milliards de yuans, dont 14 000 milliards de yuans pour la Chine.

L'énorme accroissement économique comprend non seulement l'amélioration de l'efficacité du travail existant grâce aux grands modèles, mais également les nouveaux scénarios et les nouveaux formats d'entreprise induits par les nouvelles technologies. L'exploration de ByteDance est un microcosme de la mise en œuvre d'applications d'IA, et c'est également un sujet commun auquel l'ensemble du secteur doit réfléchir.

Et c’est exactement ce que Tan Dai a souligné à plusieurs reprises lors de cette conférence de presse. Les bons modèles doivent être utilisés par tout le monde et par chaque entreprise.

# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo