MDR ! Zuckerberg a personnellement essayé de retenir l’expert en IA, mais a fini par lui dire de partir avec une soupe de poulet toxique.

Le laboratoire de superintelligence de Meta vient d'ouvrir ses portes, doté de financements et d'une puissance de calcul considérable. Son PDG, Mark Zuckerberg, est même intervenu personnellement pour promouvoir l'idée que « tout le monde possède une superintelligence ».

Mais juste à ce moment-là, le chercheur scientifique de Meta Rishabh Agarwal vient de tweeter pour annoncer son départ.

Jetons un œil à sa déclaration de démission :

C'est ma dernière semaine à @AIatMeta. Rejoindre le nouveau laboratoire Superintelligence TBD a été une décision difficile pour moi, surtout compte tenu de la concentration de talents et de la puissance de calcul qui y règne. Mais après sept ans et demi chez Google Brain, DeepMind et Meta, je ressens le besoin de prendre des risques différents.

Vous pensez que c'est le cliché habituel de la démission ? Mais attendez, il a ajouté un autre point :

La vision de Mark et Alexandr Wang en rejoignant l'équipe Superintelligence était incroyablement séduisante. Mais finalement, j'ai choisi de suivre le conseil de Mark : “Dans un monde qui évolue si rapidement, le plus grand risque est de ne prendre aucun risque.”

C'est tellement drôle. Je ne m'attendais pas à ce que la polémique toxique et sincère de Zuckerberg soit la raison pour laquelle Rishabh a remis sa lettre de démission.

Afin de remporter la compétition d'IA, le rythme de recrutement récent de Meta a été extrêmement agressif.

Zuckerberg a offert des salaires à neuf chiffres à de nombreux chercheurs de haut niveau et a même personnellement recruté des talents d'entreprises telles qu'OpenAI et Google par courrier électronique et WhatsApp, le salaire total offert atteignant parfois 100 millions de dollars.

À la mi-août, Meta a réussi à débaucher plus de 20 personnes d'OpenAI, au moins 13 de Google, 3 d'Apple, 3 de xAI et 2 d'Anthropic, soit un total de plus de 50 nouveaux employés.

Cependant, il y a eu récemment des rumeurs selon lesquelles, après que Meta ait recruté de manière agressive plus de 50 chercheurs et ingénieurs en IA pendant plusieurs mois, elle a commencé à geler le recrutement dans son département d'IA la semaine dernière, et a considérablement réduit la taille du département d'IA et réorganisé l'équipe d'IA.

Meta AI sera réorganisée en quatre équipes principales : recherche, formation (laboratoire à déterminer), produit et infrastructure. La plupart des chefs d'équipe seront directement rattachés à Wang. L'équipe de la Fondation AGI, auparavant responsable du modèle à grande échelle Llama, a également été officiellement dissoute dans le cadre de cette restructuration.

Peut-être que Rishabh a également été affecté par la tourmente de la restructuration.

Cependant, Rishabh n'était pas un fainéant chez Meta. Selon lui, en quelques mois seulement, lui et son équipe ont obtenu de nombreux résultats, notamment en favorisant les progrès post-formation des modèles de « pensée ».

Inclure spécifiquement :

  • Grâce à la mise à l’échelle RL, nous avons poussé un modèle dense de 8 milliards de paramètres vers une performance proche de celle de Deepseek-R1.
  • Utilisez des données synthétiques lors de la formation à mi-parcours pour mieux démarrer le RL.
  • Une meilleure méthode de distillation conforme à la politique a été développée.

Un examen plus approfondi du CV de Rishabh montre qu'il est un acteur fort dans le domaine de l'IA.

Il a obtenu son diplôme de premier cycle en informatique et en génie à l'Institut indien de technologie de Bombay. Il a ensuite poursuivi son doctorat à Mila, l'Institut québécois d'intelligence artificielle (IQA), où sa thèse portait sur des explorations révolutionnaires de l'apprentissage par renforcement profond, sous la direction d'Aaron Courville et de Marc Bellemare.

Google Scholar montre qu'il a participé et publié une série d'articles de recherche influents, notamment Gemini 1.5 et Gemma 2, avec respectivement plus de 2 500 et 1 200 citations ; « Deep Reinforcement Learning at the Edge of the Statistical Precipice » et « Neural Additive Models » de 2021 ont également une grande influence.

Au total, ses citations académiques ont dépassé les 10 000, avec un indice h de 34 et un indice i10 de 41. Ses recherches couvrent un large éventail de sujets, notamment la compréhension multimodale, les modèles de langage ouverts, les réseaux neuronaux interprétables et l'apprentissage par renforcement hors ligne, couvrant essentiellement tous les sujets les plus brûlants.

En termes d'expérience professionnelle, il est actuellement professeur adjoint à l'Université McGill, poste qu'il occupe depuis septembre 2024. Avant de rejoindre Meta, il a travaillé chez Google DeepMind de 2023 à 2025 en tant que chercheur scientifique, se concentrant sur l'apprentissage par renforcement, l'auto-amélioration et la distillation de grands modèles linguistiques.

De plus, il a travaillé chez Google Brain pendant 5 ans en tant que chercheur scientifique senior, menant des recherches sur l'apprentissage par renforcement profond et a remporté le prix du meilleur article au NeurIPS 2021. Avant cela, il a effectué un stage chez Waymo début 2018.

Pour Rishabh, les mots de sa déclaration de démission, « prendre un autre type de risque », peuvent être vrais.

L'expérience et l'influence qu'il a accumulées dans des entreprises comme Google et Meta sont suffisantes pour le soutenir dans la poursuite de recherches plus libres ou d'une scène plus grande.

#Bienvenue pour suivre le compte public officiel WeChat d'iFaner : iFaner (ID WeChat : ifanr), où du contenu plus passionnant vous sera présenté dès que possible.

iFanr | Lien original · Voir les commentaires · Sina Weibo