Google est devenu le « roi de l’IA ». Est-ce entièrement la faute d’OpenAI ?

16 avril 2024 Hibou Gourou

En 2016, le PDG de Google, Sundar Pichai, a fièrement annoncé au monde entier lors de la conférence des développeurs d'E/S :

Google est devenu synonyme de recherche et Alphabet deviendra à l’avenir une entreprise axée sur l’IA.

Grâce à ses efforts continus en matière d’apprentissage profond, de traitement du langage naturel et dans d’autres domaines, Google a en effet pris les devants sur la ligne de départ de cette compétition d’IA. Cependant, l'émergence soudaine de ChatGPT a amené Google, qui avait lancé l'alerte rouge, à passer du temps de paix à la préparation au temps de guerre.

Beaucoup de gens prédisent avec optimisme que Google, la montagne de l'IA qui a fondu du jour au lendemain, pourra retrouver sa majesté d'antan au plus tard l'hiver prochain. Mais ce qui a été mis en scène plus tard, c'est l'histoire d'un jeune homme tuant un dragon.

OpenAI « marche sur » Google pour traverser la rivière

Si Google traverse la rivière en sentant les pierres de l'IA, alors OpenAI traverse la rivière en « marchant sur » Google.

Lors du récent événement Google Next, Google a annoncé que le modèle le plus puissant, Gemini 1.5 Pro, est officiellement ouvert au public. Il peut prendre en charge le traitement jusqu'à 11 heures d'audio et 1 heure de vidéo, ce qui a enthousiasmé de nombreux spectateurs.

Certains internautes ont téléchargé une collection des moments sportifs les plus emblématiques de l'histoire sur Gemini 1.5 Pro et lui ont demandé d'identifier les sports dans la vidéo, les équipes/athlètes participants, les années, etc., et il peut clairement l'organiser pour vous.

Alors que les gens sont encore plongés dans le « jeu » avec Gemini 1.5 Pro, le compétitif OpenAI a annoncé le lancement de la version officielle de GPT-4 Turbo. Non seulement les fonctionnalités de base ont été considérablement mises à jour, mais elle est également dotée d'une lecture d'image intégrée. fonction. Maintenant, il a payé pour tous les ChatGPT Open aux utilisateurs.

Pendant un certain temps, Gemini 1.5 Pro, qui était censé être l'arme meurtrière de Google, est redevenu une « fleur disparue », donnant aux gens le sentiment que Wang Feng a rejoint Google.

Pourquoi dis-tu encore ? Je ne peux pas dire si c’est intentionnel ou non, mais ce n’est pas la première fois qu’OpenAI s’en prend aux nouveaux produits de Google.

En février de cette année, Google a lancé Gemini 1.5 Pro, la solution d'IA ultime sur laquelle il travaille depuis longtemps. Elle prend en charge jusqu'à 1 million de contextes. En revanche, GPT-4 Turbo ne prend en charge que 128 000 contextes.

Les gros titres explosifs ont également duré moins de quelques heures. OpenAI sur la table à cartes n'a pas besoin de prendre en compte le rythme des cartes à jouer. Retirez-le simplement et vous trouverez le roi dans le domaine de la génération vidéo IA – Sora.

Des fonctionnalités telles que la génération vidéo d'une minute, la conversion en temps réel de plusieurs objectifs, la génération d'images excellentes et stables et les capacités de compréhension du modèle mondial ont attiré l'attention du monde et supprimé les éclaboussures causées par Gemini 1.5 Pro.

En regardant le rythme de sortie des produits OpenAI dans le passé, nous pouvons constater que ses puissantes capacités de définition d'agenda sont sans aucun doute les mots clés qui ne peuvent être évités. Chaque lancement de produit majeur a capturé de manière appropriée les tendances du marché.

Auparavant, il avait été rapporté que pendant qu'Anthropic était encore en train d'évaluer les problèmes de sécurité de Claude, OpenAI s'était appuyé de manière décisive sur ChatGPT pour saisir l'avantage du premier arrivé sur le marché. Après qu'Anthropic ait reçu jusqu'à 4 milliards de dollars de financement d'Amazon, OpenAI s'est à nouveau concentré sur les fonctions de voix et d'image, donnant une gifle à Anthropic avec ChatGPT, qui peut voir, écouter et parler.

Derrière tout cela peut être indissociable de l’influence du fondateur d’OpenAI, Sam Altman. Dès qu’il était à la tête de YC, il a fait preuve d’une profonde compréhension et application de l’influence des médias.

Selon les souvenirs de la fondatrice de The Information, Jessica Lessin, Altman était particulièrement doué pour traiter avec les journalistes des médias et utilisait d'excellentes compétences en communication pour gagner la confiance des journalistes. Même pendant la bataille judiciaire d'OpenAI, il a été capable de contrôler l'orientation de l'opinion publique grâce à quelques tweets, et son influence était comparable à celle d'Elon Musk dans le monde des célébrités sur Internet.

Google est sans doute le malchanceux victime de cette stratégie à la Altman. Pourquoi ces deux titres sont-ils si importants ? Cela commence avec l’histoire de la « suppression » de Google par OpenAI.

En regardant les deux dernières années, sous l'aura d'OpenAI, le parcours de Google en matière d'IA semble un peu malheureux.

Fin 2022, ChatGPT a illuminé le monde entier de l'IA du jour au lendemain, mais Google, qui s'est levé tôt le matin, n'a rien pu faire, a regardé les « forces civiles et militaires mandchoues » dans son domaine de l'IA et a souhaité qu'il le fasse. pouvait mettre en scène chaque jour une scène où Kangxi dénonçait avec colère ses ministres.

Après avoir longtemps laissé ChatGPT, qui comptait plus de 100 millions d'utilisateurs actifs mensuels, être « arrogant et dominateur », Google a lancé à la hâte une contre-attaque en février de l'année dernière, mais cela a quand même mal commencé. Cela a dérouté l'auteur de la première photo de. une planète extrasolaire de Bard, ce qui a fait crier le public qui a regardé la conférence de presse. L'argent a également fait évaporer instantanément environ 2,75 de la valeur marchande de JD.com par Google.

Si GPT-3.5 peut encore donner à Google une lueur d'espoir de rattraper son retard, alors GPT-4 a directement supprimé ses pairs pendant une année entière.

Grâce aux bases techniques accumulées au fil des années, le navire a fait demi-tour. Après avoir fusionné Google Brain et Google Deepmind, Google d'All In AI a véritablement créé une version « remaniée » du modèle Gemini 1.0 de Bard.

Parmi eux, l'ultra-grand Gemini Ultra prétend écraser complètement GPT-4. Cependant, un jour seulement après sa sortie, il a été révélé que la vidéo de démonstration qui a brisé l'Internet mondial était fausse, à tel point que les propres employés de Google se sont retournés. et se sont fait exploser en disant : « Ce n'est pas vrai. »

Jusqu'à l'émergence de Gemini 1.5 Pro, qu'il s'agisse des idées techniques de l'architecture MoE ou de l'expérience personnelle réelle, salué par de nombreux internautes, il semblait prouver que le plus haut niveau d'IA pouvait être atteint par sa capacité à rivaliser avec GPT-4.

De plus, la capacité de traitement du contexte de 1M était encore plus puissante que celle de ses pairs à l’époque. Gemini 1.5 Pro peut maîtriser instantanément un langage obscur que seulement 200 personnes utilisent, et peut également comprendre un film muet de Buster Keaton de 44 minutes en une seule séance.

Les deux échecs de "Toutiao" ont également fait ressembler Google à Sun Wukong causant des problèmes au paradis. Peu importe à quel point il sautait de haut en bas, il ne pouvait pas sortir de la paume de Buddha OpenAI.

Il convient de mentionner qu'en termes de produits grand public, les deux sociétés se sont également comparées de manière relativement complète. Quelle que soit l’efficacité réelle, l’essentiel est que vous l’ayez et que je dois l’avoir.

Vous avez ChatGPT, j'ai Bard (Gémeaux)
Vous avez DALL·E 3, nous avons Imagen 2
Vous avez Sora, j'ai Video Poet sur PPT, et même Imagen 2 peut créer des vidéos
Même dans le domaine de la recherche, l'ancien métier de Google, OpenAI veut non seulement le remplacer, mais a aussi de plus grandes ambitions.

Il n'y a pas si longtemps, Sam Altman, PDG d'OpenAI, a souligné dans une interview exclusive avec Lex Fridman que le monde n'avait pas besoin d'une autre copie de Google.

L'implication de son entretien est qu'OpenAI utilisera la recherche LLM+ pour redéfinir le concept des moteurs de recherche comme Perplexity, et trouvera également un moyen de gagner de l'argent sans dépendre de la publicité.

La personne qui vous connaît le mieux est souvent votre ennemi

Au cours de l’année écoulée, OpenAI, qui propose des outils d’IA avancés tels que ChatGPT et Sora, est devenu la référence la plus solide dans l’ensemble du secteur de l’IA.

Il suffit de prendre quelques grands modèles auprès des grands fabricants de modèles dans la « guerre des mille modèles » mondiale, et des termes tels que « approche du GPT-4 » et « analyse comparative complète par rapport au GPT-4 » feront rire tout le monde et feront rire les gens. tout le cercle de l'IA est rempli d'une atmosphère joyeuse.

Jim Fan a récemment déclaré sur la plateforme sociale

En regardant les listes de tests de référence et les avis des internautes, les seuls qui peuvent s'implanter solidement et diriger la tendance en peu de temps sont les quatre géants : OpenAI, Anthropic, Google et Meta.

Le développement de l’IA ne peut ignorer trois éléments majeurs : la puissance de calcul, les algorithmes et les données. Comparés à Anthropic, Meta et Google, qui disposent d’argent, de personnes et de ressources, méritent évidemment davantage d’être surveillés. Dans le même temps, par rapport à Meta, la relation entre Google et OpenAI est en réalité plus profonde qu'on ne l'imaginait.

Les personnes qui vous connaissent le mieux ne sont souvent pas vos amis, mais vos adversaires.

Gu Long a dit cela dans le roman d'arts martiaux "Seven Weapons". Cette phrase s'applique également à la relation entre OpenAI et Google.

Au printemps 2017, un article universitaire intitulé « L’attention est tout ce dont vous avez besoin » a accéléré l’arrivée de la vague de l’IA générative. Le contenu de la conversation entre l'auteur de l'article et Huang Renxun est également devenu le centre d'intérêt de l'ensemble de la communauté de l'IA lors du GTC 2024.

Ce que peu de gens savent, c’est que les huit auteurs ont en réalité la même identité : des chercheurs de Google. Cependant, l'avènement de l'architecture Transformer n'a pas suscité suffisamment d'attention de la part de Google, comme l'a déclaré Sam Altman, PDG d'OpenAI :

Lorsque l'article de Transformer a été publié, je ne pense pas que quiconque chez Google ait réalisé ce que cela signifiait.

Ce n’est que peu de temps après la publication de l’article qu’OpenAI est devenu le plus grand gagnant à remporter la première part du gâteau, sous l’impulsion du chercheur en chef d’OpenAI de l’époque, Ilya Sutskever.

Aujourd'hui, les huit auteurs de l'article ont tous quitté Google. L'un des principaux auteurs, Kaiser, a également rejoint OpenAI et est l'un des inventeurs d'une nouvelle technologie appelée « Q* ». Cette situation est également arrivée à Sora, et la technologie de patch spatio-temporel derrière elle s'est également révélée reposer sur les épaules de Google Deepmind.

En 2024, aucune entreprise technologique n’est prête à rester à la traîne dans le domaine de l’IA. Le bras de fer entre OpenAI et Google, devenu plus explosif, est un petit profil de cette tendance.

Selon The Information, le cofondateur de Google, Sergey Brin, a personnellement démissionné et a appelé à retenir les employés qui étaient sur le point de passer à OpenAI. Lorsque OpenAI a débauché des employés de Google, il a promis un salaire annuel compris entre 5 et 10 millions de dollars.

En outre, des sources ont révélé que Hassabis, le patron de Google Deepmind, s’était plaint du fait que la politique de rémunération de Google lui rendait difficile d’empêcher les chercheurs de passer à OpenAI.

Bien entendu, Google n'est pas passif. Logan Kilpatrick, l'ancien responsable des relations avec les développeurs chez OpenAI, a récemment rejoint Google avec succès. Lorsque Gemini 1.5 Pro a été officiellement publié, Kilpatrick a également retweeté les tweets pour donner une dynamique à son site.

Du point de vue du financement, la concurrence entre OpenAI et Google ressemble davantage à un jeu en coulisses entre Microsoft et Google.

En regardant les grands modèles traditionnels sur le marché étranger, il semble qu'ils ne puissent pas échapper au sort d'être absorbés par les géants de la technologie.

Apple a beaucoup acheté cette année. Pour ne pas être en reste, Amazon a choisi d'investir massivement dans Anthropic, tandis que Microsoft, qui possède des startups comme OpenAI, Mistral AI et Inflection AI, prend temporairement le dessus dans la concurrence entre ces géants.

La querelle entre Microsoft et Google à l'ère de la recherche s'est également poursuivie dans la concurrence actuelle à l'ère de l'IA.

À cette époque où la recherche était reine, Google détenait fermement la domination du moteur de recherche grâce à son excellent algorithme et à son excellente expérience utilisateur. Cependant, Bing de Microsoft a toujours été incapable d'ébranler la domination de Google.

Selon les données publiées par StatCounter, en janvier 2023, la part de Google sur le marché mondial des moteurs de recherche atteignait 92,9 %, tandis que Bing n'en détenait que 3,03 %. Cette énorme différence de part de marché a permis à Bing de maintenir longtemps sa position de « numéro deux du millénaire ».

Seulement cette fois-ci, alors que l’IA commençait à émerger, Microsoft, qui avait subi des revers sur le marché des moteurs de recherche, semblait avoir retrouvé l’espoir de faire son retour.

# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo