Comment l'IA a résolu le problème du repliement des protéines
10 février 2025
Science & Technologie
Introduction : Une solution invisible
Et si tous les plus grands problèmes du monde, du changement climatique à la guérison des maladies en passant par l'élimination des déchets plastiques, et s'ils avaient tous la même solution ?
Une solution si minuscule qu'elle serait invisible.
Je suis enclin à croire que c'est possible grâce à une percée récente qui a résolu l'un des plus grands problèmes du siècle dernier : comment déterminer la structure d'une protéine.
On me l'a décrit comme l'équivalent du dernier théorème de Fermat, mais pour la biologie.
Pendant plus de six décennies, des dizaines de milliers de biologistes ont laborieusement déterminé la structure de 150 000 protéines.
Puis, en seulement quelques années, une équipe d'environ 15 personnes a déterminé la structure de 200 millions.
C'est pratiquement toutes les protéines connues pour exister dans la nature.
Alors comment ont-ils fait ? Et pourquoi cela a-t-il le potentiel de résoudre des problèmes bien au-delà du domaine de la biologie ?
Anatomie d'une protéine : La forme est la fonction
Une protéine commence simplement comme une chaîne d'acides aminés.
Chaque acide aminé possède un atome de carbone au centre, puis d'un côté se trouve un groupe amine et de l'autre un groupe carboxyle.
Et la dernière chose à laquelle il est lié pourrait être l'une des 20 chaînes latérales différentes, et c'est elle qui détermine lequel des 20 acides aminés différents constitue cette molécule.
Le groupe amine d'un acide aminé peut réagir avec le groupe carboxyle d'un autre pour former une liaison peptidique.
Ainsi, une série d'acides aminés peut se lier pour former une chaîne.
Et les poussées et tractions entre d'innombrables molécules, les forces électrostatiques, les liaisons hydrogène, les interactions avec les solvants, peuvent amener cette chaîne à s'enrouler et à se replier sur elle-même.
Cela détermine finalement la structure 3D de la protéine.
Et cette forme est ce qui compte vraiment dans la protéine.
Elle est construite dans un but spécifique, comme l'hémoglobine qui possède le site de liaison parfait pour transporter l'oxygène dans votre sang.
Ce sont des machines. Elles doivent être dans leur orientation correcte pour fonctionner ensemble et bouger, par exemple, les protéines de vos muscles.
Elles changent un peu de forme pour tirer et se contracter.
L'histoire de la détermination des structures
Mais il faudrait beaucoup de temps aux gens pour obtenir la structure d'une seule protéine.
Absolument. Alors, à quoi devraient ressembler les protéines ? On n'a commencé à répondre à cette question qu'avec des techniques expérimentales.
La première façon dont la structure des protéines a été déterminée a été de créer un cristal à partir de cette protéine.
Celui-ci a ensuite été exposé aux rayons X pour obtenir une figure de diffraction.
Et ensuite, les scientifiques travaillaient à rebours pour essayer de comprendre quelle forme de molécules créerait une telle figure.
Il a fallu 12 ans au biochimiste britannique John Kendrew pour obtenir la première structure protéique.
Sa cible était une protéine de stockage de l'oxygène appelée myoglobine, une protéine importante dans nos cœurs.
Il a d'abord essayé un cœur de cheval, mais cela a produit des cristaux plutôt petits car il n'y avait pas assez de myoglobine.
Il savait que les mammifères marins auraient beaucoup de myoglobine dans leurs muscles puisqu'ils sont les meilleurs pour conserver l'oxygène, il a donc obtenu un énorme morceau de viande de baleine du Pérou.
Cela a finalement donné à Kendrew des cristaux suffisamment grands pour créer une image de diffraction des rayons X.
Et quand elle est sortie, elle avait l'air vraiment bizarre.
Les gens s'attendaient à quelque chose d'assez logique, mathématique, compréhensible, et ça avait presque l'air, je ne dirais pas moche, mais complexe et intriqué.
Et un peu comme si vous voyez un moteur de fusée avec toutes les pièces qui dépassent.
Cette structure, qui a été qualifiée de "crotte du siècle", a valu à Kendrew le prix Nobel de chimie 1962.
Au cours des deux décennies suivantes, seulement une centaine de structures supplémentaires ont été résolues.
Même aujourd'hui, la cristallisation des protéines reste un défi majeur.
Franchement, il n'est pas rare que juste quelques structures de protéines constituent l'intégralité d'un doctorat. Parfois une seule, parfois même juste des progrès vers une seule.
Et c'est cher. La cristallographie aux rayons X peut coûter des dizaines de milliers de dollars par protéine.
Le défi de Levinthal et la naissance du CASP
Les scientifiques ont donc cherché un autre moyen de déterminer la structure des protéines.
Il ne coûte qu'environ 100 dollars pour trouver la séquence d'acides aminés d'une protéine.
Donc, si vous pouviez utiliser cela pour comprendre comment la protéine se replierait, cela économiserait beaucoup de temps, d'efforts et d'argent.
Je sais un peu comment le carbone se comporte, je sais comment le carbone se lie à un soufre et comment celui-ci pourrait se lier à côté d'un azote.
Et si ceux-là sont ici, alors je peux imaginer celui-ci se replier, créant cette liaison là-bas.
Il semble donc que si vous avez une idée de la dynamique moléculaire de base, vous pourriez être capable de comprendre comment cette protéine va se replier.
L'une des rares véritables prédictions en biologie a été celle de Linus Pauling, qui a examiné la géométrie des blocs de construction des protéines et a dit : "En fait, elles devraient former des hélices et des feuillets."
C'est ce que nous appelons la structure secondaire, les types de torsions et de virages très locaux de la protéine.
Mais au-delà des hélices et des feuillets, les biochimistes ne parvenaient pas à identifier de schémas fiables qui mèneraient à la structure finale de toutes les protéines.
L'une des raisons est que l'évolution n'a pas conçu les protéines de zéro.
C'est un peu comme un programmeur qui ne sait pas ce qu'il fait et dès que ça a l'air bien, il continue d'ajouter ce genre de choses.
Et c'est ainsi que l'on se retrouve avec ces objets à la fois incroyables et incroyablement complexes et difficiles à décrire. Ils n'ont pas de but sous-jacent de la même manière qu'une machine conçue par l'homme.
Pour illustrer à quel point ce processus peut devenir compliqué, le biologiste du MIT Cyrus Levinthal a fait un calcul rapide.
Et il a montré que même une courte chaîne protéique de 35 acides aminés peut se replier d'un nombre astronomique de façons.
Ainsi, même si un ordinateur vérifiait l'énergie et la stabilité de 30 000 configurations chaque nanoseconde, il lui faudrait 200 fois l'âge de l'univers pour trouver la structure correcte.
Refusant d'abandonner, le professeur John Moult de l'université du Maryland a lancé une compétition appelée CASP en 1994.
Le défi était simple : concevoir un modèle informatique capable de prendre une séquence d'acides aminés et de produire sa structure.
Les modélisateurs ne connaîtraient pas la structure correcte à l'avance, mais le résultat de chaque modèle serait comparé à la structure déterminée expérimentalement.
Une correspondance parfaite obtiendrait un score de 100, mais tout ce qui dépassait 90 était considéré comme suffisamment proche pour que la structure soit résolue.
Les concurrents du CASP se sont réunis dans une ancienne chapelle en bois transformée en centre de conférence à Monterey, en Californie.
Et à chaque fois qu'une prédiction n'avait pas de sens, ils étaient encouragés à taper du pied en guise de plaisanterie amicale.
Il y a eu beaucoup de tapotements de pieds.
La première année, les équipes n'ont pas pu obtenir des scores supérieurs à 40.
Rosetta et Foldit : La science citoyenne
Le premier favori était un algorithme appelé Rosetta, créé par le biologiste David Baker de l'université de Washington.
L'une de ses innovations a été de booster le calcul en regroupant la puissance de traitement d'ordinateurs inactifs dans les foyers, les écoles et les bibliothèques qui se portaient volontaires pour installer son logiciel appelé Rosetta@home.
Une partie de celui-ci comprenait un économiseur d'écran qui montrait essentiellement le cours du calcul du repliement des protéines.
Et puis nous avons commencé à recevoir des courriers de gens disant qu'ils regardaient l'économiseur d'écran et qu'ils pensaient pouvoir faire mieux que l'ordinateur.
Baker a donc eu une idée. Il a créé un jeu vidéo.
Le jeu, appelé Foldit, mettait en scène une chaîne de protéines capable de se tordre et de tourner dans différentes configurations.
Mais maintenant, au lieu que ce soit l'ordinateur qui fasse les mouvements, les joueurs, les humains, pouvaient faire les mouvements.
En trois semaines, plus de 50 000 joueurs ont mis en commun leurs efforts pour déchiffrer une enzyme qui joue un rôle clé dans le VIH.
La cristallographie aux rayons X a montré que leur résultat était correct. Les joueurs ont même été crédités comme co-auteurs de l'article de recherche.
Or, l'un des hommes qui a joué à Foldit était un ancien enfant prodige des échecs nommé Demis Hassabis.
Hassabis venait de lancer une société d'IA appelée DeepMind.
Leur algorithme d'IA AlphaGo a fait la une des journaux pour avoir battu le champion du monde Lee Sedol au jeu de Go.
L'un des coups d'AlphaGo, le coup 37, a profondément ébranlé Sedol.
Mais Hassabis n'a jamais oublié son époque de joueur de Foldit.
Alors bien sûr, j'étais fasciné par cela, juste du point de vue de la conception de jeux, ne serait-ce pas incroyable si nous pouvions imiter l'intuition de ces joueurs qui n'étaient, soit dit en passant, que des biologistes amateurs.
Après son retour de Corée, les chercheurs de DeepMind ont organisé un hackathon d'une semaine où ils ont essayé d'entraîner l'IA à jouer à Foldit.
C'était le début de l'objectif de longue date d'Hassabis d'utiliser l'IA pour faire progresser la science. Il a lancé un nouveau projet appelé AlphaFold pour résoudre le problème du repliement des protéines.
DeepMind entre en scène : AlphaFold 1
Pendant ce temps, au CASP, la qualité des prédictions des meilleurs performeurs, y compris Rosetta, avait plafonné.
En fait, la performance a décliné après le CASP 8.
Les prédictions n'étaient pas assez bonnes, même avec des ordinateurs plus rapides et un nombre croissant de structures dans la banque de données de protéines pour l'entraînement.
DeepMind espéらせ changer cela avec AlphaFold.
Sa première itération, AlphaFold 1, était un réseau de neurones profonds standard du commerce, comme ceux utilisés pour la vision par ordinateur à l'époque.
Les chercheurs l'ont entraîné sur énormément de structures de protéines provenant de la banque de données de protéines.
En entrée, AlphaFold prenait la séquence d'acides aminés de la protéine et un ensemble important d'indices donnés par l'évolution.
La biologie de l'évolution comme source de données
L'évolution est portée par les mutations, des changements dans le code génétique qui modifient à leur tour les acides aminés au sein d'une séquence protéique donnée.
Mais à mesure que les espèces évoluent, les protéines doivent conserver la forme qui leur permet de remplir leur fonction spécifique.
Par exemple, l'hémoglobine se ressemble chez l'homme, le chat, le cheval et pratiquement tous les mammifères. L'évolution dit : "Si ce n'est pas cassé, ne le répare pas."
Nous pouvons donc comparer les séquences de la même protéine entre différentes espèces dans ce tableau évolutif.
Là où les séquences sont similaires, il est probable qu'elles soient importantes pour la structure et la fonction de la protéine.
Mais même là où les séquences sont différentes, il est utile d'examiner où les mutations se produisent par paires, car elles peuvent identifier quels acides aminés sont proches les uns des autres dans la structure finale.
Supposons que deux acides aminés, une lysine chargée positivement et un acide glutamique chargé négativement, s'attirent et se maintiennent dans la protéine repliée.
Maintenant, si une mutation change la lysine en un acide aminé chargé négativement, il repousserait l'acide glutamique et déstabiliserait toute la protéine.
Par conséquent, une autre mutation doit remplacer l'acide glutamique par un acide aminé chargé positivement. C'est ce qu'on appelle la co-évolution.
Ces tableaux évolutifs constituaient une entrée importante pour AlphaFold.
En sortie, au lieu de produire directement une structure 3D, AlphaFold prédisait une représentation par paires en 2D plus simple de cette structure.
La séquence d'acides aminés est disposée horizontalement et verticalement. Chaque fois que deux acides aminés sont proches l'un de l'autre dans la structure finale, l'intersection ligne-colonne correspondante est brillante.
Les paires d'acides aminés éloignées sont sombres.
En plus des distances, la représentation par paires peut également contenir des informations sur la façon dont les molécules d'acides aminés sont tordues au sein de la structure.
AlphaFold 1 injectait la séquence de la protéine et son tableau évolutif dans son réseau de neurones profonds, qu'il avait entraîné à prédre la représentation par paires.
Une fois cela obtenu, un algorithme séparé repliait la chaîne d'acides aminés en fonction des contraintes de distance et de torsion.
Et était la prédiction finale de la structure de la protéine.
Avec ce cadre, AlphaFold a participé au CASP 13 et il a immédiatement attiré l'attention.
Il a été le grand gagnant après de nombreuses éditions.
Mais ce n'était pas parfait. Son score de 70 n'était pas suffisant pour franchir le seuil du CASP de 90.
AlphaFold 2 : Puissance de calcul et nouveaux algorithmes
DeepMind a dû retourner à la planche à dessin pour obtenir de meilleurs résultats. Hassabis a donc recruté John Jumper pour diriger AlphaFold.
AlphaFold 2 était vraiment un système consistant à concevoir notre apprentissage profond, les blocs individuels, pour être doués pour apprendre sur les protéines, avoir les types de concepts géométriques, physiques et évolutifs qui étaient nécessaires et les mettre au milieu du réseau au lieu d'un processus autour de lui. Et cela a été un boost de précision phénoménal.
Il y avait trois étapes clés pour obtenir de meilleurs résultats avec l'IA.
Premièrement, une puissance de calcul maximale. Sur ce point, DeepMind était déjà mieux positionné que quiconque au monde.
Il avait accès à l'énorme puissance de calcul de Google, y compris leurs unités de traitement de tenseurs.
Deuxièmement, ils avaient besoin d'un ensemble de données vaste et diversifié.
Les données sont-elles le plus grand obstacle ? Et pourquoi ?
Je pense qu'il est trop facile de dire que les données sont l'obstacle et nous devrions être prudents à ce sujet. AlphaFold 2 a été entraîné sur les mêmes données avec un bien meilleur apprentissage automatique qu'AlphaFold 1.
Ainsi, tout le monde surestime le blocage des données parce qu'il devient moins grave avec un meilleur apprentissage automatique.
Et c'était le troisième élément clé : de meilleurs algorithmes d'IA.
Intermède : L'IA au service de la création
Aujourd'hui, l'IA n'est pas seulement douée pour le repliement des protéines. Elle peut accomplir toutes sortes de tâches que personne n'aime, de la rédaction d'e-mails à la réponse aux appels téléphoniques.
Quelque chose que je déteste, c'est construire et maintenir un site web. C'est tellement de travail, de l'optimisation du site pour différentes plateformes à la recherche d'un bon design pour qu'il ait l'air professionnel, en passant par sa mise à jour constante avec de nouvelles informations sur l'entreprise au fur et à mesure de sa croissance.
C'est pourquoi nous nous sommes associés à Hostinger, le sponsor de la vidéo d'aujourd'hui.
Hostinger facilite énormément la création d'un site web pour vous-même ou votre entreprise, et avec leurs outils d'IA avancés, vous pouvez simplement décrire à quoi vous voulez que votre site ressemble, et en quelques secondes seulement, votre site personnalisé est opérationnel.
Hostinger est conçu pour être aussi simple que possible pour les débutants et les professionnels, donc toutes les modifications que vous devez faire après cela sont également super faciles.
Il suffit de glisser et déposer les images ou vidéos que vous voulez là où vous les voulez, ou simplement de taper ce que vous voulez dire, ou de laisser l'IA vous aidez ici aussi si l'écriture n'est pas votre truc non plus.
Et si vous voulez toujours cette touche humaine, Hostinger est toujours disponible avec un support 24h/24 et 7j/7 si jamais vous rencontrez des problèmes.
Mais quand vous avez fini de construire, en quelques clics, votre site est en ligne.
Tout est incroyablement abordable aussi, avec un domaine et un e-mail professionnel inclus gratuitement.
Alors pour mettre votre grande idée en ligne dès aujourd'hui, visitez hostinger.com/ve ou scannez ce code QR juste ici.
Et quand vous vous inscrivez, n'oubliez pas d'utiliser le code VE lors du paiement pour obtenir 10 % de réduction sur votre forfait.
Je tiens à remercier Hostinger pour avoir parrainé cette partie de la vidéo, et maintenant revenons au repliement des protéines.
L'Evoformer et le mécanisme de l'attention
Alors que l'équipe d'AlphaFold 2 cherchait de meilleurs algorithmes, elle s'est tournée vers le transformer. C'est le T de ChatGPT, et il repose sur un concept appelé attention.
Dans la phrase "L'animal n'a pas traversé la rue parce qu'il était trop fatigué", l'attention reconnaît que "il" se rapporte à l'animal et non à la rue en se basant sur le mot "fatigué".
L'attention ajoute du contexte à tout type d'information séquentielle en la décomposant en morceaux, en les convertissant en représentations numériques ou en plongements (embeddings), et en établissant des connexions entre eux.
Dans ce cas, le mot "il" et "animal".
3Blue1Brown propose une excellente série de vidéos spécifiquement sur les transformers et l'attention.
Les grands modèles de langage utilisent l'attention pour prédire le mot le plus approprié à ajouter à une phrase.
Mais AlphaFold possède également des informations séquentielles : pas des phrases, mais des séquences d'acides aminés.
Et pour les analyser, l'équipe d'AlphaFold a construit sa propre version du transformer appelée Evoformer.
L'Evoformer contenait deux tours : les informations évolutives dans la tour de biologie et les représentations par paires dans la tour de géométrie.
Le réseau de neurones profonds d'AlphaFold 1, qui commençait par une tour et prédisait l'autre, avait disparu.
Au lieu de cela, l'Evoformer d'AlphaFold 2 construit chaque tour séparément.
Il commence avec quelques suppositions initiales, des tableaux évolutifs tirés de jeux de données connus comme auparavant, et les représentations par paires basées sur des protéines connues similaires.
Et cette fois, il y a un pont reliant les deux tours qui transmet les nouveaux indices biologiques et géométriques découverts dans les deux sens.
Dans la tour de biologie, l'attention appliquée sur une colonne identifie les séquences d'acides aminés qui ont été conservées, tandis que le long d'une ligne, elle trouve les mutations d'acides aminés qui se sont produites ensemble.
Chaque fois que l'Evoformer trouve deux acides aminés étroitement liés dans le tableau évolutif, cela signifie qu'ils sont importants pour la structure, et il envoie cette information à la tour de géométrie.
Ici, l'attention est appliquée pour aider à calculer les distances entre les acides aminés.
Il y a aussi ce qu'on a appelé l'attention triangulaire qui a été introduite, qui consiste essentiellement à laisser les triplets interagir entre eux.
Pour chaque triplet d'acides aminés, AlphaFold applique l'inégalité triangulaire : la somme de deux côtés doit être supérieure au troisième.
Cela limite la distance à laquelle ces trois acides aminés peuvent se trouver les uns des autres. Cette information est utilisée pour mettre à jour la représentation par paires.
Et cela aide le modèle à produire une image cohérente de la structure.
Si la tour de géométrie trouve qu'il est impossible pour deux acides aminés d'être proches l'un de l'autre, elle dit à la première tour d'ignorer leur relation dans le tableau évolutif.
Cet échange d'informations au sein de l'Evoformer se répète 48 fois jusqu'à ce que les informations des deux tours soient affinées.
Le module de structure et la résolution du problème
Les caractéristiques géométriques apprises par ce réseau sont transmises à la deuxième innovation majeure d'AlphaFold 2 : le module de structure.
Pour chaque acide aminé, we pick three special atoms in the amino acid and say that those define a frame.
Et ce que fait le réseau, c'est qu'il imagine que tous les acides aminés commencent à l'origine, et il doit prédire la translation et la rotation appropriées pour déplacer ces repères là où ils se trouvent dans la structure réelle.
C'est donc essentiellement ce que fait le module de structure.
Mais ce qui distingue le module de structure, c'est ce qu'il ne fait pas.
Auparavant, on aurait pu imaginer que l'on voudrait coder le fait qu'il s'agit d'une chaîne et que certains résidus devraient se trouver côte à côte.
Nous ne disons pas vraiment cela explicitement à AlphaFold. C'est plutôt comme si nous lui donnions un sac d'acides aminés et qu'il était autorisé à positionner chacun d'eux séparément.
Et certains ont pensé que cela l'aidait à ne pas rester bloqué sur l'endroit où les choses devraient être placées. Il n'a pas à toujours penser à la contrainte de ces éléments formant une chaîne. C'est quelque chose qui émerge naturellement plus tard.
C'est pourquoi les vidéos de repliement AlphaFold en direct peuvent montrer des choses physiquement bizarres.
Le module de structure produit une protéine 3D, mais elle n'est pas encore prête.
Elle est recyclée au moins trois fois de plus via l'Evoformer pour acquérir une compréhension plus profonde de la protéine. C'est seulement alors que la prédiction finale est faite.
En décembre 2020, DeepMind est revenu à un CASP virtuel avec AlphaFold 2. Et cette fois, ils ont réussi.
Je vais lire un e-mail de John Moult : "Votre groupe a réalisé des performances incroyables lors du CASP 14, tant par rapport aux autres groupes qu'en termes de précision absolue du modèle. Félicitations pour ce travail."
Pour de nombreuses protéines, les prédictions d'AlphaFold 2 étaient virtuellement impossibles à distinguer des structures réelles.
Et ils ont finalement battu le score de référence de 90.
Pour moi, ayant travaillé sur ce problème pendant si longtemps, après de nombreux arrêts et redémarrages, tout d'un coup c'est une solution. Nous avons résolu le problème.
Cela vous procure une telle excitation sur le fonctionnement de la science.
Une révolution biologique et le Prix Nobel
Pendant plus de six décennies, tous les scientifiques travaillant à travers le monde sur les protéines ont laborieusement découvert environ 150 000 structures de protéines.
Puis, d'un seul coup, AlphaFold est arrivé et en a dévoilé plus de 200 millions, soit presque toutes les protéines connues pour exister dans la nature.
En quelques mois seulement, AlphaFold a fait progresser les travaux des laboratoires de recherche du monde entier de plusieurs décennies.
Il nous a directement aidés à développer un vaccin contre le paludisme. Il a permis la décomposition d'enzymes résistantes aux antibiotiques, ce qui rend à nouveau efficaces de nombreux médicaments vitaux.
Il nous a même aidés à comprendre comment les mutations de protéines mènent à diverses maladies, de la schizophrénie au cancer.
Et les biologistes étudiant des espèces peu connues et en voie de disparition ont soudainement eu accès aux protéines et à leur mécanisme de vie.
L'article sur AlphaFold 2 a été cité plus de 30 000 fois. Il a véritablement fait faire un bond de géant à notre compréhension de la vie.
John Jumper et Demis Hassabis ont reçu la moitié du prix Nobel de chimie 2024 pour cette percée.
L'autre moitié est revenue à David Baker, mais pas pour la prédiction de structures à l'aide de Rosetta. C'était plutôt pour la conception de protéines totalement nouvelles à partir de zéro.
Conception de novo : Créer les protéines du futur
C'était vraiment difficile de fabriquer de toutes nouvelles protéines qui fassent des choses. Et c'est donc en quelque sorte le problème que nous avons résolu.
Pour ce faire, il utilise le même type d'IA générative qui crée de l'art dans des programmes comme DALL-E.
Vous pouvez dire : "Dessine l'image d'un kangourou chevauchant un lapin" ou quelque chose comme ça, et il le fera.
Et c'est exactement ce que nous avons fait avec les protéines.
Sa technique, appelée RF Diffusion, est entraînée en ajoutant du bruit aléatoire à une structure de protéine connue, puis l'IA doit supprimer ce bruit.
Une fois entraînée de cette manière, on peut demander à l'IA de produire des protéines pour diverses fonctions. On lui donne une entrée de bruit aléatoire, et l'IA conçoit une toute nouvelle protéine qui fait ce qu'on lui a donné.
Ce travail a d'énormes implications. Je veux dire, imaginez que vous soyez mordu par un serpent venimeux.
Si vous avez de la chance, vous aurez accès à un antivenin préparé en extrayant le venin du type exact de serpent, lequel est ensuite injecté dans des animaux vivants, et les anticorps de cet animal sont extraits et purifiés pour vous être administrés comme antivenin.
Le problème est que les gens ont souvent des réactions allergiques à ces anticorps provenant d'autres organismes.
Mais vos chances de survie peuvent être bien meilleures avec les dernières protéines synthétiques conçues dans le laboratoire de Baker.
Ils ont créé des anticorps compatibles avec l'homme capables de neutraliser le venin mortel de serpent.
Cet antivenin pourrait être fabriqué en grandes quantités et facilement transporté là où on en a besoin.
Avec ces minuscules machines moléculaires, les possibilités sont infinies.
Quelles sont les applications qui vous enthousiasment le plus ?
Alors je pense que les vaccins vont être vraiment puissants. Nous avons un certain nombre de protéines qui sont en essais cliniques humains pour le cancer et nous travaillons actuellement sur les maladies auto-immunes.
Nous sommes vraiment enthousiasmés par des problèmes comme la capture des gaz à effet de serre, nous concevons donc des enzymes capables de fixer le méthane, de décomposer le plastique.
Ce qui rend cette approche si efficace, c'est la rapidité avec laquelle ils peuvent créer et itérer la protéine.
C'est vraiment miraculeux pour quiconque est un biochimiste scolaire conventionnel ou un spécialiste des protéines.
Nous pouvons maintenant avoir des conceptions sur ordinateur, obtenir la séquence d'acides aminés des protéines conçues, et en seulement quelques jours, nous pouvons obtenir la protéine.
Ouais, nous avons donné un nom à cela, c'est la "biochimie de cow-boy" parce qu'on y va juste aussi vite que possible et il s'avère que ça marche plutôt bien.
Conclusion : Un changement de paradigme scientifique
Ce que l'IA a fait pour les protéines n'est qu'un aperçu de ce qu'elle peut faire dans d'autres domaines et à plus grande échelle.
En science des matériaux, par exemple, le programme GNoME de DeepMind a découvert 2,2 millions de nouveaux cristaux, dont plus de 400 000 matériaux stables qui pourraient alimenter les technologies futures, des supraconducteurs aux batteries.
L'IA crée des bonds transformateurs dans la science en aidant à résoudre certains des problèmes fondamentaux qui ont bloqué le progrès humain.
Si vous pensez à l'arbre entier de la connaissance, il y a certains problèmes qui sont comme des nœuds racines : si vous les déverrouillez, si vous découvrez une solution, cela débloquerait toute une nouvelle branche ou voie de découverte.
Et grâce à cela, l'IA repousse les frontières de la connaissance humaine à une vitesse jamais vue auparavant.
Des accélérations par deux sont agréables. Elles sont géniales. Nous les aimons.
Des accélérations de 100 000 fois changent ce que vous faites. Vous faites des choses fondamentalement différentes, et vous commencez à reconstruire votre science autour des choses qui sont devenues faciles.
Et c'est ce qui m'enthousiasme. Ces découvertes représentent de véritables changements de paradigme dans la science.
Même si l'IA ne progresse pas au-delà de ce qu'elle est aujourd'hui, nous récolterons les bénéfices de ces percées pendant des décennies.
Et en supposant que l'IA continue de se développer, eh bien, elle ouvrira des opportunités que l'on pensait auparavant impossibles, qu'il s'agisse de guérir toutes les maladies, de créer de nouveaux matériaux ou de restaurer l'environnement à un état vierge.
Cela ressemble à un avenir incroyable, tant que l'IA ne prend pas le contrôle pour nous détruire tous d'abord.