Conférence Nobel : L'IA comme moteur de découverte scientifique
17 janvier 2025
Intelligence Artificielle & Science
Introduction par le Comité Nobel
Notre prochain intervenant est Demis Hassabis. Il est né en 1976 à Londres, au Royaume-Uni, et il a obtenu son doctorat en 2009 à l'University College London. Il est actuellement le PDG de Google DeepMind, également basé à Londres, au Royaume-Uni. Demis, nous attendons avec impatience votre conférence Nobel ; je vous prie de vous joindre à moi pour accueillir le Dr Hassabis.
Remerciements et origines : des échecs à l'IA
Tout d'abord, je tiens à remercier l'Académie royale des sciences de Suède et le Comité Nobel pour l'honneur de toute une vie. C'est merveilleux de voir autant de membres de ma famille, d'amis et de collègues ici aujourd'hui. Je vais parler d'AlphaFold et de son impact, mais j'aborderai également le travail que nous avons accompli en amont et la direction que prend, selon moi, l'avenir de l'IA pour la science. Mon parcours vers l'IA a commencé par les jeux, plus précisément les échecs. J'ai commencé à jouer à quatre ans et j'ai pratiqué la compétition, en étant capitaine de nombreuses équipes d'échecs juniors d'Angleterre. Jouer aux échecs à un si jeune âge a été une expérience formatrice ; cela m'a amené à réfléchir à la pensée elle-même. J'étais fasciné par la manière dont notre esprit conçoit des idées, des plans et des stratégies. Dans les camps d'entraînement, nous avions accès aux premiers ordinateurs d'échecs comme le Fidelity Chess Challenger. Il fallait appuyer physiquement sur les cases de l'échiquier pour déplacer les pièces. Alors que nous étions censés utiliser ces machines pour améliorer nos compétences, j'étais fasciné par le fait que quelqu'un ait programmé un bloc de plastique inanimé pour jouer aux échecs contre moi. J'ai commencé à lire sur le sujet et j'ai codé mon premier programme d'IA sur mon Amiga 500 à l'âge de 11 ans pour jouer à Othello. Ce programme a réussi à battre mon frère de cinq ans. J'étais émerveillé par le fait que l'on puisse faire faire quelque chose à un objet de manière indépendante. Cela m'a rendu accro aux ordinateurs et à l'IA pour la vie.
L'IA et les jeux : Le laboratoire de DeepMind
Plus de 20 ans plus tard, les jeux sont toujours au cœur de mon approche de l'IA et au centre de nos premiers travaux chez DeepMind. Nous avons lancé DeepMind en 2010 en tant que laboratoire de recherche industrielle avec pour mission de construire une intelligence artificielle générale. La vision était de créer une version moderne des laboratoires Bell. Au départ, nous avons utilisé les jeux comme terrain d'essai pour l'IA car il est facile de générer des données et de définir des objectifs clairs à optimiser. Dans la plupart des jeux, on peut spécifier de maximiser le score ou simplement de gagner. Il est clair si vous progressez avec vos idées algorithmiques. Le sommet de l'IA pour les jeux a été le jeu ancestral de Go, probablement le jeu le plus complexe jamais conçu. Il existe 10 à la puissance 170 positions possibles, ce qui est plus que le nombre d'atomes dans l'univers. Il n'y avait aucun moyen d'écrire un programme pour forcer brutalement une solution. Notre première grande percée a eu lieu en 2016 avec AlphaGo, qui a battu le champion du monde Lee Sedol 4-1 à Séoul. Il n'a pas seulement gagné ; il a inventé de nouvelles stratégies créatives comme le coup 37. Ce coup s'est avéré être le coup parfait pour décider du match 100 coups plus tard, comme si AlphaGo l'avait placé là de manière prémonitoire. AlphaGo et ses successeurs ont maîtrisé les jeux grâce à l'auto-apprentissage, où les systèmes apprennent des stratégies par eux-mêmes en jouant des millions de parties contre eux-mêmes et en apprenant de leurs erreurs. Grâce à ce processus, nous construisons un modèle de réseau neuronal qui guide efficacement le processus de recherche afin de ne pas avoir à explorer toutes les possibilités. Dans un jeu comme le Go, il existe un ensemble de possibilités insolubles à partir de n'importe quelle position. Ce modèle de réseau neuronal permet à AlphaGo d'analyser seulement une infime fraction de tous les chemins possibles. Il identifie les coups les plus probables et les plus prometteurs et quel côté est susceptible de gagner. Une fois le temps de réflexion écoulé, il produit la ligne la plus optimale qu'il a trouvée.
Le défi du repliement des protéines
Maintenant que nous avons franchi le sommet de l'IA pour les jeux, nous disposons des techniques pour nous attaquer à d'importants problèmes du monde réel, y compris de grands défis scientifiques. Nous recherchons trois critères : trouver un chemin dans un espace de recherche combinatoire, une fonction objective claire et des données disponibles ou un simulateur efficace. De nombreux problèmes scientifiques correspondent à ce profil. Pour moi, la priorité a toujours été le repliement des protéines. Les protéines sont les briques élémentaires de la vie ; presque tous les processus biologiques en dépendent. On peut considérer les protéines comme de magnifiques biomachines à l'échelle nanométrique. Les protéines sont définies par leur séquence d'acides aminés, qui se replie en structures 3D complexes. Connaître la structure renseigne sur sa fonction et est essentiel pour comprendre les maladies et accélérer la découverte de médicaments. La question est de savoir si la structure peut être prédite à partir de sa séquence d'acides aminés. En 1972, Christian Anfinsen a conjecturé que cela devrait être possible, proposant qu'une protéine prenne la forme qui minimise l'énergie libre dans le système. C'est ce qu'on a appelé le problème du repliement des protéines, lançant une quête de 50 ans pour une solution informatique. Trouver la structure expérimentalement est laborieux et peut prendre des mois ou des années pour une seule protéine. Le paradoxe de Levinthal a estimé qu'une protéine typique possède jusqu'à 10 à la puissance 300 conformations possibles. Énumérer toutes les possibilités prendrait plus de temps que l'âge de l'univers. Pourtant, dans la nature, ces protéines se replient spontanément en quelques millisecondes. Cela suggère qu'il existe une topologie dans le paysage énergétique qui guide efficacement le processus de repliement. Peut-être pouvons-nous retrouver ce processus.
AlphaFold : Résolution et impact
Une autre raison pour laquelle nous avons relevé ce défi était la disponibilité des données et des références claires. Environ 170 000 structures ont été déterminées expérimentalement et rassemblées dans la Protein Data Bank. Deuxièmement, la compétition CASP a servi de référence absolue. Le seuil critique pour une utilisation pratique était une précision de l'ordre de la largeur d'un atome. Avec AlphaFold 2, nous avons atteint cette précision atomique. Nous avons commencé avec AlphaFold 1 en 2018, qui a amélioré les prédictions mais n'avait pas atteint la précision atomique. Nous avons repensé l'architecture d'AlphaFold 2 pour le CASP 14, qui a atteint la précision requise et a essentiellement résolu le problème. AlphaFold 2 a intégré plus d'une douzaine d'innovations dans un système hybride, intégrant des contraintes évolutives et physiques. L'équipe AlphaFold était un groupe multidisciplinaire de biologistes, de chimistes et d'experts en apprentissage automatique. Le système utilisait une étape de recyclage pour affiner itérativement la prédiction. Nous avons replié les 200 millions de protéines connues de la science, mis AlphaFold en open-source et construit une base de données avec l'EMBL-EBI, offrant un accès gratuit à tous. Nous avons consulté des experts en biosécurité et en bioéthique avant de publier la base de données. Plus de 2 millions de chercheurs ont utilisé AlphaFold, et c'est devenu un outil standard en biologie. Il a aidé à concevoir des enzymes pour lutter contre la pollution plastique, à traiter des maladies négligées et à découvrir de nouveaux mécanismes dans la reproduction. Plus tôt cette année, nous avons lancé AlphaFold 3, qui modélise les interactions et la dynamique. Il peut modéliser les interactions par paires entre les protéines et d'autres molécules, ce qui est un grand pas vers la découverte de médicaments.
L'ère de la biologie numérique
Je souhaite parler des implications de ce travail pour l'IA dans la science. Nos systèmes trouvent des solutions optimales dans des espaces de recherche énormes en apprenant des modèles à partir de données ou de simulations et en les utilisant pour guider un processus de recherche. Il s'agit d'une solution générale applicable à la conception de composés chimiques pour trouver le meilleur composé médicamenteux à travers l'espace chimique. Nous entrons peut-être dans une nouvelle ère de la biologie numérique. J'ai toujours considéré la biologie comme un système de traitement de l'information. Alors que les mathématiques sont un langage de description pour la physique, l'IA pourrait être le langage de description parfait pour la biologie. Nous avons récemment créé Isomorphic Labs pour repenser la découverte de médicaments à partir de principes fondamentaux avec l'IA. Nous pourrions réduire la découverte de médicaments de plusieurs années à quelques mois ou semaines, en faisant de la science à une vitesse numérique. Mon rêve est de simuler une cellule virtuelle entière.
Perspectives théoriques et responsabilité
Je terminerai par quelques idées provocatrices. Les machines de Turing classiques peuvent faire bien plus que ce que l'on pensait auparavant en utilisant le précalcul pour développer des modèles de l'environnement afin d'explorer l'espace des solutions en temps polynomial. Je conjecture que tout motif trouvé dans la nature peut être découvert et modélisé efficacement par un algorithme d'apprentissage classique. Si les systèmes classiques peuvent modéliser certains systèmes quantiques, cela a des implications pour la théorie de la complexité et la physique fondamentale. Au-delà de la biologie, nous travaillons chez DeepMind dans les domaines de la médecine, des réacteurs à fusion, de la prévision météorologique et de la découverte de matériaux. Nous entrons peut-être dans un nouvel âge d'or de la découverte. L'IA possède un potentiel incroyable pour aider à relever les plus grands défis de l'humanité, mais elle doit être construite de manière responsable au bénéfice de tous. Les leaders du domaine doivent s'engager avec les parties prenantes pour intégrer les points de vue sur la manière dont ces systèmes devraient être déployés. Une technologie aussi transformatrice que l'IAG nécessite une attention et une prévoyance exceptionnelles. Si nous gérons cette technologie en toute sécurité, l'IAG pourrait être l'outil ultime pour nous aider à comprendre l'univers et notre place dans celui-ci. Je tiens à remercier l'équipe AlphaFold, nos collaborateurs et ma famille pour leur soutien. Merci.