Demis Hassabis : AlphaFold et l'avenir de la science
3 juillet 2022
Intelligence Artificielle / Biologie
Le problème du repliement des protéines
Revenons aux briques élémentaires de la biologie qui, je pense, constituent un autre angle sous lequel on peut commencer à comprendre l'esprit humain, le corps humain, ce qui est assez fascinant, c'est-à-dire qu'à partir des briques de base, on commence à simuler, à modéliser comment, à partir de ces briques, on peut construire des systèmes de plus en plus grands et complexes, peut-être un jour l'intégralité de la biologie humaine. Voici un autre problème que l'on pensait impossible à résoudre : le repliement des protéines. AlphaFold, ou plus précisément AlphaFold 2, a fait exactement cela. Il a résolu le repliement des protéines. Je pense que c'est l'une des plus grandes percées, certainement dans l'histoire de la biologie structurale, mais plus généralement en science. D'un point de vue général, qu'est-ce que c'est et comment ça marche ? Ensuite, nous pourrons poser quelques questions fascinantes.
Bien sûr. Pour expliquer cela aux personnes qui ne sont pas familières avec le repliement des protéines, tout d'abord, les protéines sont essentielles à toute vie. Chaque fonction de votre corps dépend des protéines. On les appelle parfois les bêtes de somme de la biologie. Si vous les examinez de près, et évidemment, dans le cadre d'AlphaFold, j'ai fait des recherches sur les protéines et la biologie structurale ces dernières années, ce sont d'incroyables petites bio-nanomachines. Elles sont incroyables si vous regardez des animations de leur fonctionnement. Les protéines sont spécifiées par leur séquence génétique appelée séquence d'acides aminés. On peut y voir leur constitution génétique. Dans la nature, elles se replient en une structure 3D. On peut se les représenter comme un chapelet de perles qui se replie en boule. L'élément clé est de connaître cette structure 3D, car la structure 3D d'une protéine est ce qui aide à déterminer ce qu'elle fait, la fonction qu'elle remplit dans votre corps. Si vous vous intéressez aux médicaments ou aux maladies, vous devez comprendre cette structure 3D car si vous voulez cibler quelque chose avec un composé médicamenteux pour bloquer une action de la protéine, vous devez comprendre où il va se lier à la surface de la protéine. Évidemment, pour ce faire, vous devez comprendre la structure 3D.
Donc la structure correspond à la fonction.
La structure correspond à la fonction. La structure est évidemment d'une certaine manière spécifiée par la séquence d'acides aminés. C'est l'essence même du problème du repliement des protéines : peut-on, à partir de la seule séquence d'acides aminés, la chaîne de lettres à une dimension, prédire immédiatement par le calcul la structure 3D ? C'est un défi majeur en biologie depuis plus de 50 ans. Il a été formulé pour la première fois par Christian Anfinsen, lauréat du prix Nobel en 1972, dans le cadre de sa conférence de remise du prix Nobel. Il a émis l'hypothèse que cela devrait être possible de passer de la séquence d'acides aminés à la structure 3D, mais il n'a pas dit comment. On me l'a décrit comme l'équivalent du dernier théorème de Fermat, mais pour la biologie.
En tant que personne qui pourrait très bien gagner le prix Nobel à l'avenir, en dehors de cela, vous devriez faire plus de choses de ce genre. Dans les marges, mettez simplement des choses aléatoires qui prendront 200 ans à résoudre. Dites que ça devrait être possible et ne donnez simplement aucune intuition.
Exactement. Je devrai m'en souvenir pour l'avenir. Il a lancé, par cette simple remarque fortuite, tout comme Fermat, tout ce domaine de la biologie computationnelle qui dure depuis 50 ans. Ils étaient bloqués et n'avaient pas vraiment progressé. Jusqu'à l'arrivée d'AlphaFold, cela se faisait expérimentalement, de manière très laborieuse. La règle empirique est qu'il faut cristalliser la protéine, ce qui est très difficile. Certaines protéines ne peuvent pas être cristallisées, comme les protéines membranaires. Ensuite, il faut utiliser des microscopes électroniques très coûteux ou des machines de cristallographie aux rayons X, un travail vraiment minutieux pour obtenir la structure 3D et la visualiser. La règle empirique en biologie expérimentale est qu'il faut à un doctorant toute sa thèse pour traiter une seule protéine. Avec AlphaFold 2, nous sommes capables de prédire la structure 3D en quelques secondes. Pendant Noël, nous avons traité l'ensemble du protéome humain, chaque protéine du corps humain, soit les 20 000 protéines. Le protéome humain est l'équivalent du génome humain mais dans l'espace des protéines. Cela a révolutionné ce que les biologistes structuraux peuvent faire car désormais, ils n'ont plus à se soucier de ces expériences laborieuses ; ils peuvent presque simplement consulter la structure de leurs protéines comme on fait une recherche Google.
La complexité biologique et le paradoxe de Levinthal
Il existe un ensemble de données sur lequel il est entraîné et sur la manière de cartographier cette séquence d'acides aminés. Tout d'abord, il est incroyable qu'une protéine, ce petit ordinateur chimique, soit capable d'effectuer ce calcul elle-même de manière distribuée et très rapidement. C'est une chose étrange. Elles ont évolué ainsi parce qu'au début, c'était une grande invention, la protéine elle-même. Il y a probablement une histoire où elles ont évolué pour posséder plusieurs de ces protéines, et ces protéines ont trouvé comment être des ordinateurs elles-mêmes de telle sorte que l'on puisse créer des structures capables d'interagir de manière complexe les unes avec les autres afin de former des fonctions de haut niveau. C'est un système étrange qu'elles ont mis au point.
Eh bien, c'est certain. Peut-être devrions-nous aussi parler des origines de la vie, mais les protéines elles-mêmes sont de magiques et incroyables bio-nanomachines. En fait, Levinthal, un autre scientifique contemporain d'Anfinsen, a inventé ce qui est devenu le paradoxe de Levinthal, qui correspond exactement à ce que vous dites. Il a calculé qu'en moyenne une protéine, qui fait peut-être 2 000 acides aminés de long, peut se replier dans environ 10 à la puissance 300 conformations différentes. Il y a 10 à la puissance 300 façons différentes dont une protéine pourrait se replier. Et pourtant, d'une manière ou d'une autre dans la nature, la physique résout cela en quelques millisecondes. Les protéines se replient dans votre corps parfois en quelques fractions de seconde. La physique résout d'une manière ou d'une autre ce problème de recherche.
Pour être clair, dans beaucoup de ces cas, vous pouvez peut-être me corriger si je me trompe, il y a souvent une façon unique pour cette séquence de se former. Parmi cet immense nombre de possibilités, elle trouve un moyen d'être stable. Dans certains cas, il peut y avoir un dysfonctionnement, ce qui entraîne de nombreux troubles, mais la plupart du temps, il s'agit d'une correspondance unique et cette correspondance unique n'est pas évidente. C'est là que réside le problème.
Exactement. Il y a généralement une correspondance unique si elle est saine. Comme vous le dites pour les maladies, par exemple Alzheimer, une conjecture est que c'est à cause d'une protéine mal repliée, une protéine qui se replie de la mauvaise manière, la protéine bêta-amyloïde. Parce qu'elle se replie mal, elle s'emmêle dans vos neurones. Il est super important de comprendre à la fois le fonctionnement sain et la maladie, de comprendre ce que font ces choses et comment elles se structurent. Bien sûr, l'étape suivante est que parfois les protéines changent de forme lorsqu'elles interagissent avec quelque chose. Elles ne sont pas nécessairement statiques en biologie.
L'architecture d'AlphaFold et l'évolution de l'IA chez DeepMind
Peut-être pouvez-vous nous faire part de choses intéressantes et belles pour vous concernant ces débuts d'AlphaFold et la résolution de ce problème, car contrairement aux jeux, cela implique des systèmes physiques réels qui se prêtent moins aux mécanismes de type auto-apprentissage (self-play). La taille de l'ensemble de données est plus petite que ce que l'on souhaiterait autrement, il faut donc être très astucieux sur certaines choses. Y a-t-il quelque chose que vous pourriez dire concernant ce qui a été très difficile à résoudre et quels sont les aspects magnifiques de la solution que vous avez trouvée ?
Je dirais qu'AlphaFold est le système le plus complexe et aussi probablement le plus significatif que nous ayons construit jusqu'à présent. Ces dernières années ont été une période incroyable de voir cela se concrétiser car, comme nous en avons parlé plus tôt, les jeux sont ce par quoi nous avons commencé, en construisant des choses comme AlphaGo et AlphaZero, mais l'objectif ultime était de les utiliser pour amorcer des systèmes d'apprentissage général que nous pourrions ensuite appliquer aux défis du monde réel. Plus précisément, ma passion concerne les défis scientifiques comme le repliement des protéines. AlphaFold est notre premier grand point de preuve en la matière. En ce qui concerne les données et le nombre d'innovations qui ont dû y être intégrées, plus de 30 algorithmes composants différents ont dû être assemblés pour craquer le repliement des protéines. Je pense que certaines des grandes innovations ont consisté à intégrer des contraintes codées en dur autour de la physique et de la biologie évolutive pour contraindre des choses comme les angles de liaison dans la protéine, mais sans impacter le système d'apprentissage. Cela a permis au système d'apprendre la physique lui-même à partir des exemples que nous avions. Il n'y avait qu'environ 150 000 protéines, même après 40 ans de biologie expérimentale. C'était notre ensemble d'entraînement, ce qui est bien moins que ce que nous aimerions normalement utiliser. Mais en utilisant diverses astuces comme l'auto-distillation — en utilisant en fait les prédictions d'AlphaFold en lesquelles il avait une grande confiance et en les réintégrant dans l'ensemble d'entraînement — nous avons agrandi l'ensemble d'entraînement. Cela a été crucial pour le fonctionnement d'AlphaFold. AlphaFold 1 produisait un distogramme, une matrice des distances par paires entre toutes les molécules de la protéine. Ensuite, il fallait un processus d'optimisation séparé pour créer la structure 3D. Ce que nous avons fait pour AlphaFold 2, c'est le rendre véritablement de bout en bout. Nous sommes passés directement de la séquence d'acides aminés à la structure 3D. En apprentissage automatique, nous avons toujours constaté que plus on peut rendre le système de bout en bout, meilleur il est. Le système est meilleur pour apprendre quelles sont les contraintes que nous ne le sommes en tant que concepteurs humains. Chaque fois que vous pouvez le laisser circuler de bout en bout et générer ce que vous recherchez réellement, vous vous en sortez mieux que d'avoir une étape intermédiaire que vous devez ensuite fabriquer à la main. Il est préférable de laisser les gradients et l'apprentissage circuler tout au long du système, de la sortie finale aux entrées.
C'est une bonne façon de commencer sur un nouveau problème. Fabriquer manuellement un tas de trucs, ajouter un tas de contraintes manuelles avec une petite part d'apprentissage et faire croître cette part d'apprentissage jusqu'à ce qu'elle consomme l'ensemble.
C'est exact. Vous pouvez voir qu'il s'agit d'une sorte de méthode que nous avons développée en réalisant de nombreux projets Alpha X réussis. La façon la plus simple de le voir est l'évolution d'AlphaGo vers AlphaZero. AlphaGo était un système d'apprentissage mais il était spécifiquement entraîné pour ne jouer qu'au Go. Dans la première version d'AlphaGo, nous voulions atteindre des performances de champion du monde, peu importe la manière d'y parvenir. Dans AlphaGo Zero, nous avons supprimé la nécessité d'utiliser des parties humaines comme point de départ, afin qu'il puisse simplement jouer contre lui-même à partir d'un point de départ aléatoire. Cela a supprimé le besoin de connaissances humaines sur le Go. AlphaZero l'a ensuite généralisé de sorte que tout ce que nous avions dans le système, y compris des choses comme la symétrie du plateau de Go, a été supprimé. AlphaZero pouvait jouer à n'importe quel jeu à deux joueurs en partant de zéro. MuZero l'a étendu de sorte que vous n'aviez même pas besoin de lui donner les règles du jeu. Il les apprenait par lui-même, de sorte qu'il pouvait également gérer les jeux vidéo aussi bien que les jeux de société.
Donc cette lignée AlphaGo, AlphaGo Zero, AlphaZero, MuZero, c'est la trajectoire complète de ce que l'on peut tirer de l'apprentissage par imitation jusqu'à l'apprentissage entièrement auto-supervisé.
Exactement. Apprendre toute la structure de l'environnement dans lequel vous êtes placé en partant de zéro et en l'amorçant par l'auto-apprentissage (self-play). Il aurait été impossible ou très difficile pour nous de construire AlphaZero ou MuZero directement dès le départ.
Même psychologiquement, parce qu'il faut croire en soi pendant très longtemps. On est constamment confronté au doute car beaucoup de gens disent que c'est impossible à faire.
Exactement. C'était déjà assez difficile de faire le Go. Tout le monde pensait que c'était impossible ou du moins à une décennie de là quand nous l'avons fait en 2015. Cela aurait été psychologiquement très difficile, et nous avons beaucoup appris en construisant AlphaGo d'abord. C'est pourquoi j'appelle l'IA une science de l'ingénierie. C'est l'une des disciplines scientifiques les plus fascinantes, mais c'est une science de l'ingénierie dans le sens où, contrairement aux sciences naturelles, le phénomène que vous étudiez n'existe pas dans la nature. Vous devez d'abord construire l'artefact, puis vous pouvez étudier comment il fonctionne.