C’est peut-être la première entreprise star de l’IA à tomber

Lorsque la marée descend, on voit clairement qui nage nu.

Il y a 3 mois, le PDG de Hugging Face, la plus grande communauté open source d'IA au monde, a fait 6 prédictions pour l'industrie de l'IA en 2024. L'une d'elles est :

Une entreprise d’IA populaire fera faillite ou sera rachetée à un prix très bas.

Je ne sais pas s’il avait un candidat précis en tête à l’époque, mais peu de temps après le début de la nouvelle année, la réalité s’est vraiment déroulée comme un scénario.

L’équipe technique est partie en masse et la populaire licorne IA s’est effondrée.

En ce qui concerne les modèles de diagrammes de Vincent, trois produits ne peuvent être ignorés : DALL-E, Midjourney et Stable Diffusion.

DALL-E est intégré à GPT-4 et est facile à invoquer. Midjourney est devenu une légende car son équipe entrepreneuriale ne compte que 11 personnes et son style de peinture est plus artistique.

Stable Diffusion est plus célèbre en raison du produit lui-même, qui est open source, gratuit et gratuit. La société derrière, Stability AI, n'est pas très connue.

Récemment, Stability AI a de nouveau été en difficulté : Robin Rombach, l'un des développeurs de Stable Diffusion, a démissionné de l'entreprise.

▲Robin Rombach.

La raison pour laquelle nous insistons sur « encore » est qu'au cours de l'année écoulée, l'équipe technique de l'entreprise a été en constante agitation, avec des changements de directeur de la technologie, directeur de l'information, vice-président de l'ingénierie, vice-président des produits, vice-président de la R&D. , directeur de recherche, responsable des grands modèles de langage, etc. Démissionnent les uns après les autres.

En août 2022, Stability a rendu public Stable Diffusion et ses utilisateurs quotidiens ont rapidement atteint les 10 millions. En octobre de la même année, Stability a finalisé un financement d'environ 100 millions de dollars américains, avec une valorisation atteignant 1 milliard de dollars américains, rejoignant ainsi les rangs des « licornes ».

Mais après plus d’un an, pourquoi la stabilité est-elle tombée de l’autel ?

La raison de la démission n'a pas été annoncée au public. Forbes estime qu'il n'y a qu'une seule raison à la fuite des cerveaux : l'entreprise n'a pas réussi à joindre les deux bouts, ne peut pas gagner d'argent et ne peut pas lever de capitaux.

Il est facile de comprendre pourquoi les sources fermées DALL-E et Midjourney utilisent des modèles d'abonnement pour gagner de l'argent. En tant que projet open source, Stable Diffusion est gratuit pour tout le monde, téléchargeable et utilisable, mais il peut encore devenir plus grand et plus fort.

Tout comme Red Hat, un modèle dans l'industrie open source, elle vend des services logiciels d'entreprise de haute qualité au côté B dans un modèle d'abonnement basé sur le système d'exploitation open source gratuit Linux, et a été acquise par IBM pour 34 $ US. milliards en 2019.

Les méthodes de profit de Stability sont principalement divisées en deux types : l'accès API à l'application Web DreamStudio de Vincent et les services de conseil et de modélisation en IA pour les entreprises.

En décembre 2023, Stability a lancé des forfaits payants à partir de 20 $ par mois pour les utilisateurs professionnels. L’utilisation non commerciale à des fins personnelles et de recherche reste gratuite.

Cependant, participer à l’explosion cambrienne de l’IA générative, c’est comme participer à une bataille royale, où les capacités personnelles, les ressources réseau et les facteurs hors site sont tous indispensables.

Contrairement à Meta et Google, Stability a une base profonde et contrairement à OpenAI, qui dispose de la puissance de calcul et des fonds de Microsoft, elle a signé un contrat avec le département de cloud computing d'Amazon conformément aux règles de l'industrie et a utilisé plus de 4 000 puces Nvidia pour former des modèles.

La formation aux modèles d’IA coûte de l’argent, l’entreprise n’est pas assez grande et des concurrents enthousiastes s’emparent des parts de marché. En octobre de l'année dernière, Stability a reçu 50 millions de dollars d'Intel pour reconstituer son sang, mais aucune somme d'argent ne pouvait se permettre de continuer à perdre de l'argent.

Bloomberg a rapporté que les dépenses de formation et de salaires de Stability en octobre 2023 s'élevaient à environ 8 millions de dollars américains, mais que ses revenus en matière de logiciels et de services en août de la même année n'étaient que de 1,2 million de dollars américains.

Forbes explique la difficulté de la stabilité sous un autre angle, affirmant que les travailleurs devraient être plus empathiques. L'entreprise était non seulement soupçonnée de devoir des salaires et de l'argent à des partenaires commerciaux, mais elle a même forcé Amazon à menacer de couper l'accès au GPU en raison du non-paiement de l'argent à temps, ce que Stability a nié.

Le conflit sur les droits d’auteur sur les images d’IA a aggravé la situation des start-ups qui n’étaient pas encore riches. Getty Images et les artistes affirment que Stability a volé des œuvres d'art et des photos pour former ses modèles, et le procès est en cours.

Par coïncidence, la relation entre Stability et son concurrent Midjourney est également tombée récemment dans un point de gel.

Début mars, Midjourney a bloqué tous les employés de Stability après avoir enquêté sur deux comptes payants soupçonnés d'être des employés de Stability tentant de voler des données, provoquant une longue panne de serveur.

Le PDG de Stability a répondu à

Des gens qui font des choses pratiques, des gens qui racontent des histoires

La relation entre Stable Diffusion et Stability n'est pas aussi pure que ChatGPT et OpenAI.

La diffusion stable est issue d'un projet universitaire, anciennement le modèle de diffusion latente, et a fait l'objet de recherches menées par l'université Ludwig-Maximilians de Munich et Runway, une société d'IA de New York.

Runway est la piste du circuit vidéo de Vincent. Il s'avère que les engrenages du destin ont déjà commencé à tourner et que l'industrie technologique est également un cercle de connaissances.

▲ Photo de : arxiv

Sept mois après la publication du document de recherche sur le projet, en juin 2022, Stability a rejoint le projet en tant que bailleur de fonds et a fourni des ressources informatiques. La propre équipe d'IA générative de Stability a également participé à la recherche.

Robin Rombach, qui a démissionné cette fois, était le chef de l'équipe de recherche de Munich et le premier auteur de l'article, puis a été recruté par Stability. Les deux collègues munichois qui ont signé le papier à côté de lui seraient partis avec lui.

Stability a sorti Stable Diffusion 3 en février de cette année et un nouveau modèle vidéo 3D SV3D en mars.Ces techniciens ont l'impression d'être au dernier poste avant de faire leurs valises et de partir.

▲ SD3 a évolué en termes de mots d'invite multi-sujets, de qualité d'image et d'orthographe du texte.

Au cours de la dernière année, Stability a fait preuve de diligence en mettant à niveau Stable Diffusion et en développant de nouveaux modèles : modèle de graphe vincentien SDXL, modèle de grand langage StableLM, modèle de génération audio Stable Audio, modèle de génération vidéo Stable Video, modèle de génération de code Stable Code et objet 3D. modèle de génération Stable Zero123…

Mais les concurrents ne chôment pas non plus : par exemple, supprimé par GPT-4, Gemini et Claude, StableLM n'a pratiquement pas fait sensation. Meta propose également Llama 2 en open source, qui concurrence directement Stability.

Aujourd'hui, de nombreux talents clés de la période fondatrice sont partis. Même si le peuple ne sera pas laissé vide, le moral des militaires sera inévitablement ébranlé. Des exemples similaires sont à venir.

Récemment, Mustafa Suleyman, co-fondateur de la startup Inflection AI, a accepté une offre de Microsoft pour diriger l'activité IA orientée consommateur de Microsoft. Il est également co-fondateur de DeepMind de Google.

▲ Mustafa Soliman.

Le produit principal d’Inflection est le chatbot Pi. Par rapport à ses pairs, l'intelligence émotionnelle de Pi est particulièrement remarquable. Il est plus empathique et se soucie de vous. Il aime ajouter des emojis. On soupçonne qu'il souffre du syndrome de flatterie dans le chat. Lorsqu'il discute avec lui, il se détend inconsciemment.

Karén Simonyan, co-fondatrice et scientifique en chef d'Inflection, ainsi que certains ingénieurs et chercheurs d'Inflection rejoignent également Microsoft.

Au cours de la bataille judiciaire contre OpenAI, le projet de Nadella d'acquérir OpenAI sans douleur a échoué en recrutant Sam Altman et des centaines d'employés déterminés à le suivre. Wan Wan Lei Qing, maintenant son souhait est exaucé par Inflexion.

Cette fois, Microsoft a rangé l'équipe de direction d'Inflection et a intégré son modèle dans l'activité de cloud computing Azure de Microsoft. L'argent dépensé était bien inférieur à la valorisation. Même s'il ne s'agissait pas d'une acquisition, c'était proche d'une acquisition par nature. Inflection et Pi existaient de nom seulement.

Il n’est pas difficile de constater que lorsque l’industrie de l’IA est en pleine tourmente, le talent reste la clé. Partout où il y a des gens, il y aura des griefs, et là où il y aura des griefs, il y aura des conflits. L'industrie technologique ne fait pas exception, avec des combats internes constants et des guerres commerciales sans fin.

L’exode des talents est une histoire que Google ne connaît que trop bien. Dans le même temps, le style de gestion de Stability a été remis en question, tout comme celui de Google, qui a subi de nombreux bouleversements.

▲ Emad Mostaque.

Emad Mostaque, PDG de Stability, a été gestionnaire de fonds spéculatifs au cours de sa dernière carrière et a passé la plupart de son temps dans le commerce du pétrole. Bien qu'il soit diplômé en informatique, il n'a jamais fondé ni rejoint une entreprise technologique auparavant. l'habitude de parler grand et de s'attribuer le mérite.La culture d'entreprise est influencée de haut en bas.

Plusieurs employés actuels et anciens ont révélé que Mostaque exagérait souvent. Il a qualifié Amazon de « partenaire stratégique » lors du financement, mais en fait, les deux n'étaient que des parties A et B ordinaires. Il a déclaré que Stability construisait des modèles d'IA personnalisés pour des dizaines de clients, mais lorsqu'on lui a demandé des noms spécifiques, seuls une société holding indienne et un pays africain ont été nommés.

Ce qui est encore plus flagrant, c'est que la relation entre Mostaque et son épouse, une ancienne responsable des relations publiques, et les finances de l'entreprise n'est pas claire, même si l'entreprise est déjà en difficulté financière.

En juillet 2023, l'ancien chercheur de Google, David Ha, a démissionné après 8 mois en tant que directeur de recherche sur la stabilité. Dans une interview avec les médias, il a déclaré que malgré son entrée précoce dans le jeu et la promotion du développement de l'industrie de l'IA, la stabilité doit encore trouver sa place. posséder des fossés pour rester compétitifs. La puissance, il semble qu'il y ait quelque chose dans les mots.

Après le départ de nombreux talents, les propres capacités techniques de Stability sont en effet une question sans réponse.

Dans le communiqué annonçant le financement, Stability a, intentionnellement ou non, obscurci l'existence des chercheurs de Stable Diffusion et a seulement déclaré que Stable Diffusion est un générateur de texte en image puissant, gratuit et open source, et que c'est l'entreprise derrière ce projet. produit. .

Il est vrai que la moitié des mots sont omis, mais le professeur Björn Ommer, qui a laissé son nom sur le papier, en est très mécontent : « Dans la recherche scientifique, si vous prenez quelque chose de quelque part, vous devez l'attribuer à quelqu'un et citer quelqu'un."

L'actuel chercheur en chef de Stability est Varun Jhampani, qui a quitté Google Brain. Je crains que lui seul sache combien de temps il peut être retenu.

L’étape de la vente de l’imagination est terminée et la période du remaniement sanglant est arrivée.

La nature gratuite et open source de Stable Diffusion est d'une grande importance pour la communauté de l'IA.

Sa licence est très souple, n'exigeant qu'une utilisation éthique et légale du modèle, autorisant une utilisation commerciale et non commerciale, permettant à chacun de créer, développer des produits et même de lancer librement ses propres projets.

Par exemple, pour le problème de la stabilité des caractères dans les images générées par l'IA, Midjourney a proposé la solution Character Reference, et la communauté open source a lancé le module complémentaire IP Adapter for Stable Diffusion.

Dans le même temps, les modèles open source sont plus susceptibles de devenir des armes permettant aux Deepfake de générer du contenu violent et pornographique. De plus, certaines startups basées sur Stable Diffusion ne marquent pas leurs licences et leurs sources technologiques, et utilisent simplement un nouveau look pour tromper de l'argent.

Les partisans de l'open source soutiennent souvent que le développement de l'IA est meilleur lorsque les gens n'ont pas à payer pour accéder aux modèles et qu'il y a plus de transparence sur la manière dont les modèles sont formés.

Mais les entreprises qui développent des modèles ne le ressentent peut-être pas. En raison de préoccupations concernant les « problèmes de concurrence et de sécurité », OpenAI a cessé de partager les résultats de ses recherches à partir de GPT-4 et les a remplacés par des rapports techniques.

D’un point de vue commercial, la décision d’OpenAI est compréhensible. La dualité de l'open source et le conflit entre open source et source fermée sont également la quintessence de la concurrence actuelle en matière d'IA.

En 2023, le développement de l'IA générative sera comme un feu qui fait rage, avec des géants et des start-ups en compétition pour lancer des modèles et des produits commercialisés. Cependant, cette scène florissante n'engendre pas seulement le succès, mais contient aussi des mensonges, du mal, de la pêche en eaux troubles. et exagération. Le coureur qui l'accompagnait, qui profitait du moment, attendait avec attention le moment où la bulle éclaterait.

Mostaque, ancien gestionnaire de fonds, est en effet très sensible aux changements de température de l'eau : il a senti très tôt l'intensification de la concurrence dans le secteur de l'IA et a un jour prévenu les salariés : « Vous mourrez tous en 2023 ».

Il existe déjà trop de choix sur le marché et les valorisations temporaires ne sont qu’une image miroir. Comment voler de ses propres ailes est le prochain sujet pour les entreprises d’IA.

Inflection n'a levé que 1,3 milliard de dollars en juin de l'année dernière, mais après avoir reçu une branche d'olivier de Microsoft, ses dirigeants et ses principaux dirigeants sont partis simplement parce qu'ils ne voyaient pas l'avenir.

Dans une interview avec Bloomberg, Mustafa Suleyman a déclaré que le nombre d'utilisateurs quotidiens de Pi avait atteint 1 million, mais qu'il n'avait pas encore trouvé de modèle commercial efficace.

Bien que Pi ait une attitude amicale et sympathique, un pur robot de chat destiné aux consommateurs ne peut pas supporter une valorisation aussi élevée. Il est préférable de se tourner vers les services de personnalisation d'entreprise et de se voir confier des tâches importantes par des géants.

Même si Inflection promet que les services de Pi « ne changeront pas immédiatement », certains estiment que sa mort surviendra tôt ou tard. De même, le grand gars qui a développé le modèle est parti, et les utilisateurs ne peuvent s'empêcher de s'inquiéter de savoir si Stable Diffusion 3, qui est toujours invité à des tests, peut toujours être open source.

En réponse à l'annonce de la démission de Robin Rombach, un porte-parole de la Stabilité l'a remercié pour ses efforts et lui a souhaité un avenir radieux, tout en soulignant l'orientation de développement de l'entreprise : la commercialisation de la technologie.

Lorsqu’il s’agit de commercialisation de l’IA, chacun a ses propres problèmes. En février de cette année, Andy Jassy, ​​PDG d'Amazon Cloud Computing Services, a déclaré lors d'une conférence téléphonique avec des analystes que les revenus de l'IA générative « sont encore relativement faibles ».

Mais il a ajouté que presque toutes les entreprises grand public d'Amazon possèdent déjà ou auront des produits d'IA générative qui devraient générer des dizaines de milliards de dollars de revenus dans les années à venir.

Microsoft ne veut pas être appelé « le service informatique d'OpenAI » et provoquer le mécontentement des investisseurs, alors pendant qu'il développe des projets d'IA internes, il débauche des gens partout et investit dans Mistral AI, un concurrent d'OpenAI.

À cet égard, OpenAI a également son mot à dire : lors de sa création en 2015, il s'agissait d'une organisation à but non lucratif chargée de développer l'AGI de la manière la plus susceptible de bénéficier à l'humanité entière. entreprise à but lucratif et a incité Microsoft à investir. La raison est en fait très simple : l’IA est trop chère.

Le chiffre d'affaires annualisé d'OpenAI a dépassé 1,6 milliard de dollars l'année dernière et repose principalement sur trois piliers pour gagner de l'argent : les abonnements des membres, les frais pour les appels API des développeurs et le partage des revenus avec les produits Microsoft.

Musk a critiqué à plusieurs reprises la « dégénérescence » d'OpenAI, affirmant qu'elle est devenue une société fermée contrôlée par Microsoft qui poursuit la maximisation des profits. Sam Altman s'est montré indifférent et a déclaré qu'il lui manquait le Musk du passé.

2024 est la deuxième année de l'IA générative, et les sujets brûlants sont passés des chatbots et des images de Vincent aux vidéos de Vincent et à l'intelligence incarnée des robots.

Les émotions des concurrents sont également devenues plus nerveuses : s'ils n'ont pas été séparés de l'offre de financement et n'ont pas trouvé un scénario d'atterrissage commercial, il ne faudra peut-être pas longtemps pour voir de nombreuses entreprises dites vedettes faire faillite.

Aux premiers jours du développement de l’IA, l’optimisme du marché est élevé et tolérera la vente de rêves, d’expériences difficiles et d’imaginations du futur.

Cependant, la valeur de l'intelligence artificielle doit se refléter dans la pratique. L'enthousiasme des investisseurs en lobbying doit se transformer en produits pour lesquels les consommateurs sont prêts à payer. La poésie de la technologie doit encore s'écrire sur le terrain d'Internet plutôt que dans le vide. .

L’une des 10 principales prédictions de Forbes en matière d’IA pour 2024 est la suivante : la stabilité disparaîtra. C’est peut-être vrai, la question est de savoir quel degré de stabilité viendra ensuite.

Elle est aussi vive que le gel d’automne et peut conjurer les désastres maléfiques. E-mail professionnel : [email protected]

# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo