Demis Hassabis, John Jumper, David Baker - Comment l'IA a résolu le problème du repliement des protéines

Demis Hassabis, John Jumper, David Baker

Comment l'IA a résolu le problème du repliement des protéines

10 février 2025

Science & Technologie

Illustration de Demis Hassabis, John Jumper, David Baker

Introduction : Une solution invisible

Derek Muller

Et si tous les plus grands problèmes du monde, du changement climatique à la guérison des maladies en passant par l'élimination des déchets plastiques, et s'ils avaient tous la même solution ?

Derek Muller

Une solution si minuscule qu'elle serait invisible.

Derek Muller

Je suis enclin à croire que c'est possible grâce à une percée récente qui a résolu l'un des plus grands problèmes du siècle dernier : comment déterminer la structure d'une protéine.

Demis Hassabis

On me l'a décrit comme l'équivalent du dernier théorème de Fermat, mais pour la biologie.

Derek Muller

Pendant plus de six décennies, des dizaines de milliers de biologistes ont laborieusement déterminé la structure de 150 000 protéines.

Derek Muller

Puis, en seulement quelques années, une équipe d'environ 15 personnes a déterminé la structure de 200 millions.

Derek Muller

C'est pratiquement toutes les protéines connues pour exister dans la nature.

Derek Muller

Alors comment ont-ils fait ? Et pourquoi cela a-t-il le potentiel de résoudre des problèmes bien au-delà du domaine de la biologie ?

Anatomie d'une protéine : La forme est la fonction

Derek Muller

Une protéine commence simplement comme une chaîne d'acides aminés.

Derek Muller

Chaque acide aminé possède un atome de carbone au centre, puis d'un côté se trouve un groupe amine et de l'autre un groupe carboxyle.

Derek Muller

Et la dernière chose à laquelle il est lié pourrait être l'une des 20 chaînes latérales différentes, et c'est elle qui détermine lequel des 20 acides aminés différents constitue cette molécule.

Derek Muller

Le groupe amine d'un acide aminé peut réagir avec le groupe carboxyle d'un autre pour former une liaison peptidique.

Derek Muller

Ainsi, une série d'acides aminés peut se lier pour former une chaîne.

Derek Muller

Et les poussées et tractions entre d'innombrables molécules, les forces électrostatiques, les liaisons hydrogène, les interactions avec les solvants, peuvent amener cette chaîne à s'enrouler et à se replier sur elle-même.

Derek Muller

Cela détermine finalement la structure 3D de la protéine.

Derek Muller

Et cette forme est ce qui compte vraiment dans la protéine.

Derek Muller

Elle est construite dans un but spécifique, comme l'hémoglobine qui possède le site de liaison parfait pour transporter l'oxygène dans votre sang.

John Jumper

Ce sont des machines. Elles doivent être dans leur orientation correcte pour fonctionner ensemble et bouger, par exemple, les protéines de vos muscles.

John Jumper

Elles changent un peu de forme pour tirer et se contracter.

L'histoire de la détermination des structures

Derek Muller

Mais il faudrait beaucoup de temps aux gens pour obtenir la structure d'une seule protéine.

John Jumper

Absolument. Alors, à quoi devraient ressembler les protéines ? On n'a commencé à répondre à cette question qu'avec des techniques expérimentales.

Derek Muller

La première façon dont la structure des protéines a été déterminée a été de créer un cristal à partir de cette protéine.

Derek Muller

Celui-ci a ensuite été exposé aux rayons X pour obtenir une figure de diffraction.

Derek Muller

Et ensuite, les scientifiques travaillaient à rebours pour essayer de comprendre quelle forme de molécules créerait une telle figure.

Derek Muller

Il a fallu 12 ans au biochimiste britannique John Kendrew pour obtenir la première structure protéique.

Derek Muller

Sa cible était une protéine de stockage de l'oxygène appelée myoglobine, une protéine importante dans nos cœurs.

Derek Muller

Il a d'abord essayé un cœur de cheval, mais cela a produit des cristaux plutôt petits car il n'y avait pas assez de myoglobine.

Derek Muller

Il savait que les mammifères marins auraient beaucoup de myoglobine dans leurs muscles puisqu'ils sont les meilleurs pour conserver l'oxygène, il a donc obtenu un énorme morceau de viande de baleine du Pérou.

Derek Muller

Cela a finalement donné à Kendrew des cristaux suffisamment grands pour créer une image de diffraction des rayons X.

John Jumper

Et quand elle est sortie, elle avait l'air vraiment bizarre.

John Jumper

Les gens s'attendaient à quelque chose d'assez logique, mathématique, compréhensible, et ça avait presque l'air, je ne dirais pas moche, mais complexe et intriqué.

John Jumper

Et un peu comme si vous voyez un moteur de fusée avec toutes les pièces qui dépassent.

Derek Muller

Cette structure, qui a été qualifiée de "crotte du siècle", a valu à Kendrew le prix Nobel de chimie 1962.

Derek Muller

Au cours des deux décennies suivantes, seulement une centaine de structures supplémentaires ont été résolues.

Derek Muller

Même aujourd'hui, la cristallisation des protéines reste un défi majeur.

John Jumper

Franchement, il n'est pas rare que juste quelques structures de protéines constituent l'intégralité d'un doctorat. Parfois une seule, parfois même juste des progrès vers une seule.

Derek Muller

Et c'est cher. La cristallographie aux rayons X peut coûter des dizaines de milliers de dollars par protéine.

Le défi de Levinthal et la naissance du CASP

Derek Muller

Les scientifiques ont donc cherché un autre moyen de déterminer la structure des protéines.

Derek Muller

Il ne coûte qu'environ 100 dollars pour trouver la séquence d'acides aminés d'une protéine.

Derek Muller

Donc, si vous pouviez utiliser cela pour comprendre comment la protéine se replierait, cela économiserait beaucoup de temps, d'efforts et d'argent.

Derek Muller

Je sais un peu comment le carbone se comporte, je sais comment le carbone se lie à un soufre et comment celui-ci pourrait se lier à côté d'un azote.

Derek Muller

Et si ceux-là sont ici, alors je peux imaginer celui-ci se replier, créant cette liaison là-bas.

Derek Muller

Il semble donc que si vous avez une idée de la dynamique moléculaire de base, vous pourriez être capable de comprendre comment cette protéine va se replier.

John Jumper

L'une des rares véritables prédictions en biologie a été celle de Linus Pauling, qui a examiné la géométrie des blocs de construction des protéines et a dit : "En fait, elles devraient former des hélices et des feuillets."

John Jumper

C'est ce que nous appelons la structure secondaire, les types de torsions et de virages très locaux de la protéine.

Derek Muller

Mais au-delà des hélices et des feuillets, les biochimistes ne parvenaient pas à identifier de schémas fiables qui mèneraient à la structure finale de toutes les protéines.

Derek Muller

L'une des raisons est que l'évolution n'a pas conçu les protéines de zéro.

John Jumper

C'est un peu comme un programmeur qui ne sait pas ce qu'il fait et dès que ça a l'air bien, il continue d'ajouter ce genre de choses.

John Jumper

Et c'est ainsi que l'on se retrouve avec ces objets à la fois incroyables et incroyablement complexes et difficiles à décrire. Ils n'ont pas de but sous-jacent de la même manière qu'une machine conçue par l'homme.

Derek Muller

Pour illustrer à quel point ce processus peut devenir compliqué, le biologiste du MIT Cyrus Levinthal a fait un calcul rapide.

Derek Muller

Et il a montré que même une courte chaîne protéique de 35 acides aminés peut se replier d'un nombre astronomique de façons.

Derek Muller

Ainsi, même si un ordinateur vérifiait l'énergie et la stabilité de 30 000 configurations chaque nanoseconde, il lui faudrait 200 fois l'âge de l'univers pour trouver la structure correcte.

Derek Muller

Refusant d'abandonner, le professeur John Moult de l'université du Maryland a lancé une compétition appelée CASP en 1994.

Derek Muller

Le défi était simple : concevoir un modèle informatique capable de prendre une séquence d'acides aminés et de produire sa structure.

Derek Muller

Les modélisateurs ne connaîtraient pas la structure correcte à l'avance, mais le résultat de chaque modèle serait comparé à la structure déterminée expérimentalement.

Derek Muller

Une correspondance parfaite obtiendrait un score de 100, mais tout ce qui dépassait 90 était considéré comme suffisamment proche pour que la structure soit résolue.

Derek Muller

Les concurrents du CASP se sont réunis dans une ancienne chapelle en bois transformée en centre de conférence à Monterey, en Californie.

Derek Muller

Et à chaque fois qu'une prédiction n'avait pas de sens, ils étaient encouragés à taper du pied en guise de plaisanterie amicale.

Derek Muller

Il y a eu beaucoup de tapotements de pieds.

Derek Muller

La première année, les équipes n'ont pas pu obtenir des scores supérieurs à 40.

Rosetta et Foldit : La science citoyenne

Derek Muller

Le premier favori était un algorithme appelé Rosetta, créé par le biologiste David Baker de l'université de Washington.

Derek Muller

L'une de ses innovations a été de booster le calcul en regroupant la puissance de traitement d'ordinateurs inactifs dans les foyers, les écoles et les bibliothèques qui se portaient volontaires pour installer son logiciel appelé Rosetta@home.

David Baker

Une partie de celui-ci comprenait un économiseur d'écran qui montrait essentiellement le cours du calcul du repliement des protéines.

David Baker

Et puis nous avons commencé à recevoir des courriers de gens disant qu'ils regardaient l'économiseur d'écran et qu'ils pensaient pouvoir faire mieux que l'ordinateur.

Derek Muller

Baker a donc eu une idée. Il a créé un jeu vidéo.

Derek Muller

Le jeu, appelé Foldit, mettait en scène une chaîne de protéines capable de se tordre et de tourner dans différentes configurations.

David Baker

Mais maintenant, au lieu que ce soit l'ordinateur qui fasse les mouvements, les joueurs, les humains, pouvaient faire les mouvements.

Derek Muller

En trois semaines, plus de 50 000 joueurs ont mis en commun leurs efforts pour déchiffrer une enzyme qui joue un rôle clé dans le VIH.

Derek Muller

La cristallographie aux rayons X a montré que leur résultat était correct. Les joueurs ont même été crédités comme co-auteurs de l'article de recherche.

Derek Muller

Or, l'un des hommes qui a joué à Foldit était un ancien enfant prodige des échecs nommé Demis Hassabis.

Derek Muller

Hassabis venait de lancer une société d'IA appelée DeepMind.

Derek Muller

Leur algorithme d'IA AlphaGo a fait la une des journaux pour avoir battu le champion du monde Lee Sedol au jeu de Go.

Derek Muller

L'un des coups d'AlphaGo, le coup 37, a profondément ébranlé Sedol.

Derek Muller

Mais Hassabis n'a jamais oublié son époque de joueur de Foldit.

Demis Hassabis

Alors bien sûr, j'étais fasciné par cela, juste du point de vue de la conception de jeux, ne serait-ce pas incroyable si nous pouvions imiter l'intuition de ces joueurs qui n'étaient, soit dit en passant, que des biologistes amateurs.

Derek Muller

Après son retour de Corée, les chercheurs de DeepMind ont organisé un hackathon d'une semaine où ils ont essayé d'entraîner l'IA à jouer à Foldit.

Derek Muller

C'était le début de l'objectif de longue date d'Hassabis d'utiliser l'IA pour faire progresser la science. Il a lancé un nouveau projet appelé AlphaFold pour résoudre le problème du repliement des protéines.

DeepMind entre en scène : AlphaFold 1

Derek Muller

Pendant ce temps, au CASP, la qualité des prédictions des meilleurs performeurs, y compris Rosetta, avait plafonné.

Derek Muller

En fait, la performance a décliné après le CASP 8.

Derek Muller

Les prédictions n'étaient pas assez bonnes, même avec des ordinateurs plus rapides et un nombre croissant de structures dans la banque de données de protéines pour l'entraînement.

Derek Muller

DeepMind espéらせ changer cela avec AlphaFold.

Derek Muller

Sa première itération, AlphaFold 1, était un réseau de neurones profonds standard du commerce, comme ceux utilisés pour la vision par ordinateur à l'époque.

Derek Muller

Les chercheurs l'ont entraîné sur énormément de structures de protéines provenant de la banque de données de protéines.

Derek Muller

En entrée, AlphaFold prenait la séquence d'acides aminés de la protéine et un ensemble important d'indices donnés par l'évolution.

La biologie de l'évolution comme source de données

Derek Muller

L'évolution est portée par les mutations, des changements dans le code génétique qui modifient à leur tour les acides aminés au sein d'une séquence protéique donnée.

Derek Muller

Mais à mesure que les espèces évoluent, les protéines doivent conserver la forme qui leur permet de remplir leur fonction spécifique.

Derek Muller

Par exemple, l'hémoglobine se ressemble chez l'homme, le chat, le cheval et pratiquement tous les mammifères. L'évolution dit : "Si ce n'est pas cassé, ne le répare pas."

Derek Muller

Nous pouvons donc comparer les séquences de la même protéine entre différentes espèces dans ce tableau évolutif.

Derek Muller

Là où les séquences sont similaires, il est probable qu'elles soient importantes pour la structure et la fonction de la protéine.

Derek Muller

Mais même là où les séquences sont différentes, il est utile d'examiner où les mutations se produisent par paires, car elles peuvent identifier quels acides aminés sont proches les uns des autres dans la structure finale.

Derek Muller

Supposons que deux acides aminés, une lysine chargée positivement et un acide glutamique chargé négativement, s'attirent et se maintiennent dans la protéine repliée.

Derek Muller

Maintenant, si une mutation change la lysine en un acide aminé chargé négativement, il repousserait l'acide glutamique et déstabiliserait toute la protéine.

Derek Muller

Par conséquent, une autre mutation doit remplacer l'acide glutamique par un acide aminé chargé positivement. C'est ce qu'on appelle la co-évolution.

Derek Muller

Ces tableaux évolutifs constituaient une entrée importante pour AlphaFold.

Derek Muller

En sortie, au lieu de produire directement une structure 3D, AlphaFold prédisait une représentation par paires en 2D plus simple de cette structure.

Derek Muller

La séquence d'acides aminés est disposée horizontalement et verticalement. Chaque fois que deux acides aminés sont proches l'un de l'autre dans la structure finale, l'intersection ligne-colonne correspondante est brillante.

Derek Muller

Les paires d'acides aminés éloignées sont sombres.

Derek Muller

En plus des distances, la représentation par paires peut également contenir des informations sur la façon dont les molécules d'acides aminés sont tordues au sein de la structure.

Derek Muller

AlphaFold 1 injectait la séquence de la protéine et son tableau évolutif dans son réseau de neurones profonds, qu'il avait entraîné à prédre la représentation par paires.

Derek Muller

Une fois cela obtenu, un algorithme séparé repliait la chaîne d'acides aminés en fonction des contraintes de distance et de torsion.

Derek Muller

Et était la prédiction finale de la structure de la protéine.

Derek Muller

Avec ce cadre, AlphaFold a participé au CASP 13 et il a immédiatement attiré l'attention.

Derek Muller

Il a été le grand gagnant après de nombreuses éditions.

Derek Muller

Mais ce n'était pas parfait. Son score de 70 n'était pas suffisant pour franchir le seuil du CASP de 90.

AlphaFold 2 : Puissance de calcul et nouveaux algorithmes

Derek Muller

DeepMind a dû retourner à la planche à dessin pour obtenir de meilleurs résultats. Hassabis a donc recruté John Jumper pour diriger AlphaFold.

John Jumper

AlphaFold 2 était vraiment un système consistant à concevoir notre apprentissage profond, les blocs individuels, pour être doués pour apprendre sur les protéines, avoir les types de concepts géométriques, physiques et évolutifs qui étaient nécessaires et les mettre au milieu du réseau au lieu d'un processus autour de lui. Et cela a été un boost de précision phénoménal.

Derek Muller

Il y avait trois étapes clés pour obtenir de meilleurs résultats avec l'IA.

Derek Muller

Premièrement, une puissance de calcul maximale. Sur ce point, DeepMind était déjà mieux positionné que quiconque au monde.

Derek Muller

Il avait accès à l'énorme puissance de calcul de Google, y compris leurs unités de traitement de tenseurs.

Derek Muller

Deuxièmement, ils avaient besoin d'un ensemble de données vaste et diversifié.

Derek Muller

Les données sont-elles le plus grand obstacle ? Et pourquoi ?

John Jumper

Je pense qu'il est trop facile de dire que les données sont l'obstacle et nous devrions être prudents à ce sujet. AlphaFold 2 a été entraîné sur les mêmes données avec un bien meilleur apprentissage automatique qu'AlphaFold 1.

John Jumper

Ainsi, tout le monde surestime le blocage des données parce qu'il devient moins grave avec un meilleur apprentissage automatique.

Derek Muller

Et c'était le troisième élément clé : de meilleurs algorithmes d'IA.

Intermède : L'IA au service de la création

Derek Muller

Aujourd'hui, l'IA n'est pas seulement douée pour le repliement des protéines. Elle peut accomplir toutes sortes de tâches que personne n'aime, de la rédaction d'e-mails à la réponse aux appels téléphoniques.

Derek Muller

Quelque chose que je déteste, c'est construire et maintenir un site web. C'est tellement de travail, de l'optimisation du site pour différentes plateformes à la recherche d'un bon design pour qu'il ait l'air professionnel, en passant par sa mise à jour constante avec de nouvelles informations sur l'entreprise au fur et à mesure de sa croissance.

Derek Muller

C'est pourquoi nous nous sommes associés à Hostinger, le sponsor de la vidéo d'aujourd'hui.

Derek Muller

Hostinger facilite énormément la création d'un site web pour vous-même ou votre entreprise, et avec leurs outils d'IA avancés, vous pouvez simplement décrire à quoi vous voulez que votre site ressemble, et en quelques secondes seulement, votre site personnalisé est opérationnel.

Derek Muller

Hostinger est conçu pour être aussi simple que possible pour les débutants et les professionnels, donc toutes les modifications que vous devez faire après cela sont également super faciles.

Derek Muller

Il suffit de glisser et déposer les images ou vidéos que vous voulez là où vous les voulez, ou simplement de taper ce que vous voulez dire, ou de laisser l'IA vous aidez ici aussi si l'écriture n'est pas votre truc non plus.

Derek Muller

Et si vous voulez toujours cette touche humaine, Hostinger est toujours disponible avec un support 24h/24 et 7j/7 si jamais vous rencontrez des problèmes.

Derek Muller

Mais quand vous avez fini de construire, en quelques clics, votre site est en ligne.

Derek Muller

Tout est incroyablement abordable aussi, avec un domaine et un e-mail professionnel inclus gratuitement.

Derek Muller

Alors pour mettre votre grande idée en ligne dès aujourd'hui, visitez hostinger.com/ve ou scannez ce code QR juste ici.

Derek Muller

Et quand vous vous inscrivez, n'oubliez pas d'utiliser le code VE lors du paiement pour obtenir 10 % de réduction sur votre forfait.

Derek Muller

Je tiens à remercier Hostinger pour avoir parrainé cette partie de la vidéo, et maintenant revenons au repliement des protéines.

L'Evoformer et le mécanisme de l'attention

Derek Muller

Alors que l'équipe d'AlphaFold 2 cherchait de meilleurs algorithmes, elle s'est tournée vers le transformer. C'est le T de ChatGPT, et il repose sur un concept appelé attention.

Derek Muller

Dans la phrase "L'animal n'a pas traversé la rue parce qu'il était trop fatigué", l'attention reconnaît que "il" se rapporte à l'animal et non à la rue en se basant sur le mot "fatigué".

Derek Muller

L'attention ajoute du contexte à tout type d'information séquentielle en la décomposant en morceaux, en les convertissant en représentations numériques ou en plongements (embeddings), et en établissant des connexions entre eux.

Derek Muller

Dans ce cas, le mot "il" et "animal".

Derek Muller

3Blue1Brown propose une excellente série de vidéos spécifiquement sur les transformers et l'attention.

Derek Muller

Les grands modèles de langage utilisent l'attention pour prédire le mot le plus approprié à ajouter à une phrase.

Derek Muller

Mais AlphaFold possède également des informations séquentielles : pas des phrases, mais des séquences d'acides aminés.

Derek Muller

Et pour les analyser, l'équipe d'AlphaFold a construit sa propre version du transformer appelée Evoformer.

Derek Muller

L'Evoformer contenait deux tours : les informations évolutives dans la tour de biologie et les représentations par paires dans la tour de géométrie.

Derek Muller

Le réseau de neurones profonds d'AlphaFold 1, qui commençait par une tour et prédisait l'autre, avait disparu.

Derek Muller

Au lieu de cela, l'Evoformer d'AlphaFold 2 construit chaque tour séparément.

Derek Muller

Il commence avec quelques suppositions initiales, des tableaux évolutifs tirés de jeux de données connus comme auparavant, et les représentations par paires basées sur des protéines connues similaires.

Derek Muller

Et cette fois, il y a un pont reliant les deux tours qui transmet les nouveaux indices biologiques et géométriques découverts dans les deux sens.

Derek Muller

Dans la tour de biologie, l'attention appliquée sur une colonne identifie les séquences d'acides aminés qui ont été conservées, tandis que le long d'une ligne, elle trouve les mutations d'acides aminés qui se sont produites ensemble.

Derek Muller

Chaque fois que l'Evoformer trouve deux acides aminés étroitement liés dans le tableau évolutif, cela signifie qu'ils sont importants pour la structure, et il envoie cette information à la tour de géométrie.

Derek Muller

Ici, l'attention est appliquée pour aider à calculer les distances entre les acides aminés.

Kathryn Tunyasuvunakool

Il y a aussi ce qu'on a appelé l'attention triangulaire qui a été introduite, qui consiste essentiellement à laisser les triplets interagir entre eux.

Derek Muller

Pour chaque triplet d'acides aminés, AlphaFold applique l'inégalité triangulaire : la somme de deux côtés doit être supérieure au troisième.

Derek Muller

Cela limite la distance à laquelle ces trois acides aminés peuvent se trouver les uns des autres. Cette information est utilisée pour mettre à jour la représentation par paires.

Kathryn Tunyasuvunakool

Et cela aide le modèle à produire une image cohérente de la structure.

Derek Muller

Si la tour de géométrie trouve qu'il est impossible pour deux acides aminés d'être proches l'un de l'autre, elle dit à la première tour d'ignorer leur relation dans le tableau évolutif.

Derek Muller

Cet échange d'informations au sein de l'Evoformer se répète 48 fois jusqu'à ce que les informations des deux tours soient affinées.

Le module de structure et la résolution du problème

Derek Muller

Les caractéristiques géométriques apprises par ce réseau sont transmises à la deuxième innovation majeure d'AlphaFold 2 : le module de structure.

Kathryn Tunyasuvunakool

Pour chaque acide aminé, we pick three special atoms in the amino acid and say that those define a frame.

Kathryn Tunyasuvunakool

Et ce que fait le réseau, c'est qu'il imagine que tous les acides aminés commencent à l'origine, et il doit prédire la translation et la rotation appropriées pour déplacer ces repères là où ils se trouvent dans la structure réelle.

Kathryn Tunyasuvunakool

C'est donc essentiellement ce que fait le module de structure.

Derek Muller

Mais ce qui distingue le module de structure, c'est ce qu'il ne fait pas.

Kathryn Tunyasuvunakool

Auparavant, on aurait pu imaginer que l'on voudrait coder le fait qu'il s'agit d'une chaîne et que certains résidus devraient se trouver côte à côte.

Kathryn Tunyasuvunakool

Nous ne disons pas vraiment cela explicitement à AlphaFold. C'est plutôt comme si nous lui donnions un sac d'acides aminés et qu'il était autorisé à positionner chacun d'eux séparément.

Kathryn Tunyasuvunakool

Et certains ont pensé que cela l'aidait à ne pas rester bloqué sur l'endroit où les choses devraient être placées. Il n'a pas à toujours penser à la contrainte de ces éléments formant une chaîne. C'est quelque chose qui émerge naturellement plus tard.

Derek Muller

C'est pourquoi les vidéos de repliement AlphaFold en direct peuvent montrer des choses physiquement bizarres.

Derek Muller

Le module de structure produit une protéine 3D, mais elle n'est pas encore prête.

Derek Muller

Elle est recyclée au moins trois fois de plus via l'Evoformer pour acquérir une compréhension plus profonde de la protéine. C'est seulement alors que la prédiction finale est faite.

Derek Muller

En décembre 2020, DeepMind est revenu à un CASP virtuel avec AlphaFold 2. Et cette fois, ils ont réussi.

John Jumper

Je vais lire un e-mail de John Moult : "Votre groupe a réalisé des performances incroyables lors du CASP 14, tant par rapport aux autres groupes qu'en termes de précision absolue du modèle. Félicitations pour ce travail."

Derek Muller

Pour de nombreuses protéines, les prédictions d'AlphaFold 2 étaient virtuellement impossibles à distinguer des structures réelles.

Derek Muller

Et ils ont finalement battu le score de référence de 90.

John Moult

Pour moi, ayant travaillé sur ce problème pendant si longtemps, après de nombreux arrêts et redémarrages, tout d'un coup c'est une solution. Nous avons résolu le problème.

John Moult

Cela vous procure une telle excitation sur le fonctionnement de la science.

Une révolution biologique et le Prix Nobel

Derek Muller

Pendant plus de six décennies, tous les scientifiques travaillant à travers le monde sur les protéines ont laborieusement découvert environ 150 000 structures de protéines.

Derek Muller

Puis, d'un seul coup, AlphaFold est arrivé et en a dévoilé plus de 200 millions, soit presque toutes les protéines connues pour exister dans la nature.

Derek Muller

En quelques mois seulement, AlphaFold a fait progresser les travaux des laboratoires de recherche du monde entier de plusieurs décennies.

Derek Muller

Il nous a directement aidés à développer un vaccin contre le paludisme. Il a permis la décomposition d'enzymes résistantes aux antibiotiques, ce qui rend à nouveau efficaces de nombreux médicaments vitaux.

Derek Muller

Il nous a même aidés à comprendre comment les mutations de protéines mènent à diverses maladies, de la schizophrénie au cancer.

Derek Muller

Et les biologistes étudiant des espèces peu connues et en voie de disparition ont soudainement eu accès aux protéines et à leur mécanisme de vie.

Derek Muller

L'article sur AlphaFold 2 a été cité plus de 30 000 fois. Il a véritablement fait faire un bond de géant à notre compréhension de la vie.

Derek Muller

John Jumper et Demis Hassabis ont reçu la moitié du prix Nobel de chimie 2024 pour cette percée.

Derek Muller

L'autre moitié est revenue à David Baker, mais pas pour la prédiction de structures à l'aide de Rosetta. C'était plutôt pour la conception de protéines totalement nouvelles à partir de zéro.

Conception de novo : Créer les protéines du futur

David Baker

C'était vraiment difficile de fabriquer de toutes nouvelles protéines qui fassent des choses. Et c'est donc en quelque sorte le problème que nous avons résolu.

Derek Muller

Pour ce faire, il utilise le même type d'IA générative qui crée de l'art dans des programmes comme DALL-E.

David Baker

Vous pouvez dire : "Dessine l'image d'un kangourou chevauchant un lapin" ou quelque chose comme ça, et il le fera.

David Baker

Et c'est exactement ce que nous avons fait avec les protéines.

Derek Muller

Sa technique, appelée RF Diffusion, est entraînée en ajoutant du bruit aléatoire à une structure de protéine connue, puis l'IA doit supprimer ce bruit.

Derek Muller

Une fois entraînée de cette manière, on peut demander à l'IA de produire des protéines pour diverses fonctions. On lui donne une entrée de bruit aléatoire, et l'IA conçoit une toute nouvelle protéine qui fait ce qu'on lui a donné.

Derek Muller

Ce travail a d'énormes implications. Je veux dire, imaginez que vous soyez mordu par un serpent venimeux.

Derek Muller

Si vous avez de la chance, vous aurez accès à un antivenin préparé en extrayant le venin du type exact de serpent, lequel est ensuite injecté dans des animaux vivants, et les anticorps de cet animal sont extraits et purifiés pour vous être administrés comme antivenin.

Derek Muller

Le problème est que les gens ont souvent des réactions allergiques à ces anticorps provenant d'autres organismes.

Derek Muller

Mais vos chances de survie peuvent être bien meilleures avec les dernières protéines synthétiques conçues dans le laboratoire de Baker.

Derek Muller

Ils ont créé des anticorps compatibles avec l'homme capables de neutraliser le venin mortel de serpent.

Derek Muller

Cet antivenin pourrait être fabriqué en grandes quantités et facilement transporté là où on en a besoin.

Derek Muller

Avec ces minuscules machines moléculaires, les possibilités sont infinies.

Derek Muller

Quelles sont les applications qui vous enthousiasment le plus ?

David Baker

Alors je pense que les vaccins vont être vraiment puissants. Nous avons un certain nombre de protéines qui sont en essais cliniques humains pour le cancer et nous travaillons actuellement sur les maladies auto-immunes.

David Baker

Nous sommes vraiment enthousiasmés par des problèmes comme la capture des gaz à effet de serre, nous concevons donc des enzymes capables de fixer le méthane, de décomposer le plastique.

Derek Muller

Ce qui rend cette approche si efficace, c'est la rapidité avec laquelle ils peuvent créer et itérer la protéine.

David Baker

C'est vraiment miraculeux pour quiconque est un biochimiste scolaire conventionnel ou un spécialiste des protéines.

David Baker

Nous pouvons maintenant avoir des conceptions sur ordinateur, obtenir la séquence d'acides aminés des protéines conçues, et en seulement quelques jours, nous pouvons obtenir la protéine.

David Baker

Ouais, nous avons donné un nom à cela, c'est la "biochimie de cow-boy" parce qu'on y va juste aussi vite que possible et il s'avère que ça marche plutôt bien.

Conclusion : Un changement de paradigme scientifique

Derek Muller

Ce que l'IA a fait pour les protéines n'est qu'un aperçu de ce qu'elle peut faire dans d'autres domaines et à plus grande échelle.

Derek Muller

En science des matériaux, par exemple, le programme GNoME de DeepMind a découvert 2,2 millions de nouveaux cristaux, dont plus de 400 000 matériaux stables qui pourraient alimenter les technologies futures, des supraconducteurs aux batteries.

Derek Muller

L'IA crée des bonds transformateurs dans la science en aidant à résoudre certains des problèmes fondamentaux qui ont bloqué le progrès humain.

Demis Hassabis

Si vous pensez à l'arbre entier de la connaissance, il y a certains problèmes qui sont comme des nœuds racines : si vous les déverrouillez, si vous découvrez une solution, cela débloquerait toute une nouvelle branche ou voie de découverte.

Derek Muller

Et grâce à cela, l'IA repousse les frontières de la connaissance humaine à une vitesse jamais vue auparavant.

John Jumper

Des accélérations par deux sont agréables. Elles sont géniales. Nous les aimons.

John Jumper

Des accélérations de 100 000 fois changent ce que vous faites. Vous faites des choses fondamentalement différentes, et vous commencez à reconstruire votre science autour des choses qui sont devenues faciles.

Derek Muller

Et c'est ce qui m'enthousiasme. Ces découvertes représentent de véritables changements de paradigme dans la science.

Derek Muller

Même si l'IA ne progresse pas au-delà de ce qu'elle est aujourd'hui, nous récolterons les bénéfices de ces percées pendant des décennies.

Derek Muller

Et en supposant que l'IA continue de se développer, eh bien, elle ouvrira des opportunités que l'on pensait auparavant impossibles, qu'il s'agisse de guérir toutes les maladies, de créer de nouveaux matériaux ou de restaurer l'environnement à un état vierge.

Derek Muller

Cela ressemble à un avenir incroyable, tant que l'IA ne prend pas le contrôle pour nous détruire tous d'abord.

Retour aux entretiens de Demis Hassabis, John Jumper, David Baker