Google lance un modèle d’IA à succès ! Prédire toutes les biomolécules sur Terre accélérera considérablement la recherche sur le traitement de maladies telles que le cancer
DeepMind, propriété de Google, a fait sensation du jour au lendemain dans le monde universitaire.
Le 8 mai, DeepMind a officiellement annoncé un nouveau modèle d'IA : AlphaFold 3.
Des articles de recherche pertinents ont été publiés dans le magazine faisant autorité « Nature » et ont fait la une dès leur publication.
Après ChatGPT, il existe d’innombrables modèles d’IA, mais celui qui est le plus qualifié pour prétendre changer le monde n’est peut-être qu’AlphaFold 3.
La super évolution d’AlphaFold rend le monde biologique plus « haute définition »
Nous avons appris dans les cours de biologie au collège que les protéines sont des molécules à longue chaîne formées en connectant des acides aminés via des liaisons peptidiques et repliées en structures tridimensionnelles complexes dans l'espace.
La structure tridimensionnelle détermine la fonction de la protéine et affecte directement la conception des médicaments et le traitement des maladies.
On peut dire que la prédiction de la structure des protéines est l’une des propositions les plus importantes en biologie.
Cependant, prédire la structure tridimensionnelle des protéines est une tâche difficile et nécessite souvent des expériences complexes. Cela a même été décrit comme « un problème qui préoccupe les biologistes depuis 50 ans ».
En 2016, AlphaGo de DeepMind a vaincu un joueur professionnel de neuf dan et a réécrit l'ancienne compétence du Go.
AlphaFold de DeepMind veut déchiffrer les codes de la biologie et pénétrer les mystères de la vie elle-même.
En 2018, AlphaFold 1 est sorti.
En 2020, AlphaFold 2 a été lancé, qui permet déjà de prédire avec précision la forme des protéines à grande échelle et jusqu'au niveau atomique en quelques minutes.
Aujourd’hui, nous disposons d’AlphaFold 3, une IA aux ambitions encore plus grandes : aller au-delà des protéines pour explorer toutes les molécules biologiques.
Les biomolécules sont les molécules qui composent les organismes vivants, notamment les protéines, l'ADN, l'ARN, etc.
DeepMind estime que ce n'est qu'en comprenant comment les biomolécules interagissent dans des millions de combinaisons que nous pourrons commencer à véritablement comprendre les processus de la vie.
En un mot, AlphaFold 3 couvre un spectre plus large que son prédécesseur et peut prédire avec précision la structure des molécules biologiques telles que les protéines, l'ADN, l'ARN, les ligands et la manière dont elles interagissent.
Examinons d'abord quelques résultats de prédiction d'AlphaFold 3.
7PNM est la protéine de pointe d’un virus du rhume.
Comme le montre la figure, AlphaFold 3 prédit la structure du 7PNM (partie bleue) lorsqu'il interagit avec des anticorps (partie verte) et des monosaccharides (partie jaune), ce qui est cohérent avec la structure réelle (partie grise).
Ces prédictions ont du sens. En étudiant ces protéines, les scientifiques peuvent mieux comprendre le système immunitaire et les coronavirus, dont le COVID-19, et même proposer de meilleures options de traitement.
En plus des structures protéiques, AlphaFold peut prédire les complexes moléculaires, des structures complexes composées de plusieurs molécules.
L’enzyme illustrée ci-dessous provient d’un champignon du sol nocif pour les plantes.
Les résultats de prédiction d'AlphaFold, comprenant une protéine enzymatique (partie bleue), un ion (sphère jaune) et certains monosaccharides (partie jaune), correspondent à la structure réelle (partie grise).
Une compréhension plus approfondie de la manière dont cette enzyme interagit avec les cellules végétales pourrait aider les chercheurs à développer des cultures plus saines et plus résistantes, apportant ainsi des avantages pratiques à la production agricole.
De même, AlphaFold 3 prédit un complexe moléculaire composé d’une protéine (partie bleue), d’un brin d’ARN (partie violette) et de deux ions (partie jaune), qui correspond également étroitement à la structure réelle (partie grise).
Ce complexe est impliqué dans la synthèse des protéines, l’un des processus fondamentaux de la vie cellulaire et de la santé, et son importance pour la recherche est tout aussi profonde.
En montrant l'exactitude des résultats de prédiction et en mettant l'accent sur les utilisations associées, DeepMind veut dire au monde qu'AlphaFold 3 est un « modèle révolutionnaire ».
D’une part, le champ de la recherche est plus large. Élargir le champ de vision au-delà des protéines, en particulier des petites molécules telles que les ligands, peut couvrir davantage de médicaments.
D’un autre côté, la précision est également améliorée. Pour les interactions protéiques avec d’autres types moléculaires, AlphaFold 3 améliore la précision d’au moins 50 % par rapport aux méthodes de prédiction existantes. Certaines des interactions importantes ont même été améliorées de 100 %.
De cette manière, AlphaFold 3 peut bénéficier à davantage de recherche, accélérer la conception de médicaments, promouvoir la génomique, développer des cultures plus saines, développer des matériaux biorenouvelables…
En parlant de principes techniques, AlphaFold 3 est basé sur l'amélioration d'AlphaFold 2. Le cœur est l'architecture d'apprentissage en profondeur Evoformer et utilise un réseau de diffusion similaire à Midjourney.
Le processus d'utilisation d'AlphaFold 3 est un peu comme discuter avec un grand modèle de langage. Saisissez une description d'une biomolécule et AlphaFold 3 génère une structure tridimensionnelle de ces molécules et étudie comment elles interagissent.
Le processus d'AlphaFold 3 donnant des résultats de prédiction est similaire au modèle de diffusion de graphes vincentiens d'IA qui débruit progressivement, en partant d'un nuage atomique flou et en convergeant progressivement vers une structure moléculaire précise.
L'IA générative qui parle le langage humain améliore la productivité des travailleurs des cabines. AlphaFold ne signifie rien de plus pour les scientifiques que cela.
Prédire la structure des protéines en laboratoire peut coûter du temps et des centaines de milliers de dollars à un doctorat. Il existe des centaines de millions de prédictions, et même des millions de personnes ne seront peut-être pas en mesure de les réaliser au cours de leur vie.
Mais avec AlphaFold, les scientifiques peuvent poser des questions audacieuses et des hypothèses innovantes, puis les tester en laboratoire pour accélérer le processus de recherche.
Une phrase de DeepMind suffit pour résumer l’importance d’AlphaFold 3 pour les gens ordinaires :
AlphaFold 3 amène le monde de la biologie en HD.
Remettez AlphaFold au monde, en attendant une nouvelle renaissance de la découverte scientifique
Afin de se moquer de la source fermée d'OpenAI, Musk lui a donné un surnom : CloseAI.
Google, qui a contribué à plusieurs articles OpenAI, a un esprit plus open source à certains égards.
En juillet 2021, AlphaFold 2 a publié un article dans Nature et a également rendu le code open source.
À ce jour, AlphaFold 2 a été utilisé pour prédire des centaines de millions de structures. Des millions de chercheurs dans le monde utilisent AlphaFold 2 dans des domaines tels que les vaccins contre le paludisme, les traitements contre le cancer et la conception d'enzymes.
Également en juillet 2021, DeepMind a collaboré avec l'Institut européen de bioinformatique (EMBL-EBI) pour publier la base de données sur la structure des protéines AlphaFold, fournissant ainsi l'image la plus complète et la plus précise du protéome humain à ce jour.
DeepMind a mentionné dans son blog officiel qu'il s'agit de l'un des ensembles de données les plus importants depuis la cartographie du génome humain. Ils vont désormais mettre gratuitement la puissance d'AlphaFold entre les mains des chercheurs scientifiques du monde entier.
En un an, plus de 500 000 chercheurs ont utilisé la base de données AlphaFold pour visualiser plus de 2 millions de structures, accélérant ainsi la résolution de problèmes réels tels que la pollution plastique et la résistance aux antibiotiques.
Depuis, la base de données n’a cessé de s’enrichir.
En juillet 2022, DeepMind a publié les structures prédites de presque toutes les protéines connues de la science, totalisant plus de 200 millions, ce qui, outre les humains, comprend également les structures prédites des plantes, des bactéries, des animaux et d'autres organismes.
La base de données AlphaFold s'apparente à une « recherche Google » de structures protéiques, mais aussi à un univers protéique étoilé. La structure tridimensionnelle des protéines est la pierre angulaire de la vie. Elle est exquise et belle, ce qui rend les gens émerveillés par la magie de la création de la nature.
Cependant, l’AlphaFold 3 sorti cette fois-ci a une attitude légèrement plus conservatrice que l’AlphaFold 2, ce qui a suscité quelques critiques.
AlphaFold 3 n'est actuellement pas open source et ne peut pas être déployé localement. Les chercheurs ne peuvent accéder gratuitement à la plupart des fonctions que via la dernière plateforme de recherche de DeepMind, AlphaFold Server, et son utilisation est non commerciale.
Ce qui freine le plus le progrès scientifique, c'est le nombre d'accès au service : seules 10 prédictions peuvent être faites par jour.
Derrière ce comportement avare, DeepMind peut avoir ses propres considérations commerciales : sa filiale Isomorphic Labs a coopéré avec des sociétés pharmaceutiques pour appliquer AlphaFold 3 à la conception de médicaments.
Demis Hassabis, co-fondateur et PDG de Google DeepMind, s'est dit optimiste quant au fait que les premiers médicaments conçus par l'IA pourraient être prêts à être testés dans les prochaines années.
Bien entendu, AlphaFold a encore des limites.
Le biologiste structural chinois Yan Ning a répondu un jour en 2022 à la question de savoir si AlphaFold 2 remplacerait les scientifiques.
En termes de Nav/Cav, AlphaFold 2 est toujours bloqué à son niveau de 2017, et lors des tests d'interaction entre de nouvelles petites molécules et protéines, aucune des prédictions de l'IA n'était correcte.
Yan Ning a expliqué que la science biostructurale ne concerne pas seulement le repliement, mais aussi la compréhension des changements dynamiques des protéines, la compréhension des interactions avec d'autres macromolécules biologiques ou petites molécules régulatrices et la compréhension de l'état des cellules in situ. C'est un domaine dans lequel l'IA est encore impuissante.
Aujourd'hui, AlphaFold 3 fait un grand pas en avant là où AlphaFold 2 a échoué, en permettant de voir la possibilité de prédire les interactions de différentes biomolécules, mais il reste axé sur les prédictions statiques des structures moléculaires, qui peuvent parfois produire des hallucinations.
Dans une précédente interview, Demis Hassabis avait critiqué le battage médiatique autour de l’IA.
Il estime que l'IA devrait être utilisée comme « l'outil ultime de la science », à l'instar du modèle AlphaFold pour prédire la structure des protéines. L'humanité est sur le point d'inaugurer une nouvelle renaissance de la découverte scientifique.
Le héros voit la même chose. Huang Jenxun de Nvidia est également très optimiste quant à la piste de l'IA dans le domaine médical et biotechnologique. Il a présenté de nombreux services médicaux d'IA lors de la conférence GTC AI 2024 et a conclu des accords avec des entreprises telles que Johnson & Johnson dans ce domaine. de chirurgie et d’imagerie médicale coopèrent.
Sora simule le monde physique, tandis qu'AlphaFold 3 nous permet de comprendre le monde biologique et revient à nos attentes initiales en matière d'IA : accélérer la découverte scientifique, promouvoir le progrès humain et comprendre la vie elle-même.
Bien que l’AGI soit encore loin, les textes, les images, les vidéos et les molécules de protéines sont différents les uns des autres, mais ils se font écho.
L’IA est en effet devenue si puissante et de plus en plus pertinente dans la vie quotidienne, et nous pouvons nous attendre à ce que davantage d’innovations émergent et que davantage de mystères soient résolus chaque jour.
# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.
Ai Faner | Lien original · Voir les commentaires · Sina Weibo