L'IA et la révolution de l'apprentissage profond
17 mai 2017
Intelligence Artificielle
Une nouvelle révolution industrielle
Notre monde change de bien des façons, et l'une des choses qui va avoir un impact énorme sur notre avenir est l'intelligence artificielle, l'IA, apportant une nouvelle révolution industrielle.
Les révolutions industrielles précédentes ont étendu la puissance mécanique de l'homme.
Cette nouvelle révolution, ce deuxième âge de la machine, va étendre nos capacités cognitives, notre puissance mentale.
Les ordinateurs ne vont pas seulement remplacer le travail manuel, mais aussi le travail mental.
Alors, où en sommes-nous aujourd'hui ?
Le succès d'AlphaGo et l'apprentissage automatique
Vous avez peut-être entendu parler de ce qui s'est passé en mars dernier, lorsqu'un système d'apprentissage automatique appelé AlphaGo a utilisé l'apprentissage profond pour battre le champion du monde au jeu de Go.
Le Go est un ancien jeu chinois qui était beaucoup plus difficile à maîtriser pour les ordinateurs que le jeu d'échecs.
Comment avons-nous réussi maintenant, après des décennies de recherche en IA ?
AlphaGo a été entraîné à jouer au Go, d'abord en observant des dizaines de millions de coups joués par de très bons joueurs humains, puis en jouant contre lui-même des millions de parties.
L'apprentissage automatique permet aux ordinateurs d'apprendre à partir d'exemples, d'apprendre à partir de données.
L'apprentissage automatique s'est avéré être une clé pour injecter des connaissances dans les ordinateurs.
Et c'est important, car la connaissance est ce qui permet l'intelligence.
Le défi de la connaissance intuitive
L'intégration de connaissances dans les ordinateurs était un défi pour les approches précédentes de l'IA.
Pourquoi ?
Il y a beaucoup de choses que nous connaissons intuitivement, de sorte que nous ne pouvons pas les communiquer verbalement.
Nous n'avons pas d'accès conscient à cette connaissance intuitive.
Comment pouvons-nous programmer les ordinateurs avec ces connaissances ?
Quelle est la solution ?
La solution est que les machines apprennent ces connaissances par elles-mêmes, tout comme nous le faisons.
Et c'est important, car la connaissance est ce qui permet l'intelligence.
Les principes de l'intelligence et l'apprentissage profond
Ma mission a été de contribuer à découvrir et à comprendre les principes de l'intelligence par l'apprentissage, qu'il soit animal, humain ou automatique.
Mes collègues et moi croyons qu'il existe quelques principes clés, tout comme les lois de la physique, des principes simples qui pourraient expliquer notre propre intelligence et nous aider à construire des machines intelligentes.
Par exemple, pensez aux lois de l'aérodynamique, qui sont assez générales pour expliquer le vol des oiseaux et des avions.
Ne serait-ce pas extraordinaire de découvrir des principes aussi simples mais puissants qui expliqueraient l'intelligence elle-même ?
Eh bien, nous avons fait quelques progrès.
Mes collaborateurs et moi avons contribué ces dernières années à une révolution de l'IA avec nos recherches sur les réseaux de neurones et l'apprentissage profond, une approche de l'apprentissage automatique qui s'inspire du cerveau.
Cela a commencé par la reconnaissance vocale sur vos téléphones avec des réseaux de neurones depuis 2012.
Peu après, une percée a eu lieu dans la vision par ordinateur.
Les ordinateurs peuvent désormais très bien reconnaître le contenu des images.
En fait, ils approchent les performances humaines sur certains tests de référence au cours des cinq dernières années.
Un ordinateur peut désormais obtenir une compréhension intuitive de l'aspect visuel d'un plateau de Go, comparable à celle des meilleurs joueurs humains.
Langage naturel et limites actuelles
Plus récemment, à la suite de certaines découvertes faites dans mon laboratoire, l'apprentissage profond a été utilisé pour traduire d'une langue à une autre, et vous allez commencer à le voir dans Google Traduction.
Cela étend la capacité de l'ordinateur à comprendre et à générer le langage naturel.
Mais ne vous y trompez pas, nous sommes encore très, très loin d'une machine qui serait aussi capable que l'humain d'apprendre à maîtriser de nombreux aspects de notre monde.
L'apprentissage non supervisé et l'exemple de l'enfant
Prenons donc un exemple.
Même un enfant de deux ans est capable d'apprendre des choses d'une manière que les ordinateurs ne sont pas capables de faire actuellement.
Un enfant de deux ans maîtrise en fait la physique intuitive.
Elle sait que si elle lâche une balle, elle va tomber.
Lorsqu'elle renverse des liquides, elle s'attend au désordre qui en résulte.
Ses parents n'ont pas besoin de lui enseigner les lois de Newton ou les équations différentielles.
Elle découvre toutes ces choses par elle-même de manière non supervisée.
L'apprentissage non supervisé reste en fait l'un des défis majeurs pour l'IA, et il faudra peut-être encore plusieurs décennies de recherche fondamentale pour résoudre ce problème.
Les niveaux de représentation
L'apprentissage non supervisé tente en fait de découvrir des représentations de données.
Laissez-moi vous montrer un exemple.
Considérez une page sur l'écran que vous voyez avec vos yeux ou que l'ordinateur voit comme une image, un ensemble de pixels.
Pour répondre à une question sur le contenu de l'image, vous devez en comprendre la signification de haut niveau.
Et cette signification de haut niveau correspond au niveau de représentation le plus élevé dans votre cerveau.
Plus bas, vous avez le sens individuel des mots, et encore plus bas, vous avez les caractères qui composent les mots.
Et ces caractères peuvent être rendus de différentes manières avec les différents traits qui les composent.
Et ces traits sont composés de contours, et ces contours sont composés de pixels.
Ce sont donc différents niveaux de représentation.
Mais les pixels ne suffisent pas à eux seuls pour donner un sens à l'image, pour répondre à une question de haut niveau sur le contenu de la page.
Votre cerveau possède en fait ces différents niveaux de représentation, en commençant par les neurones de la première zone visuelle du cortex, V1, qui reconnaissent les contours, puis les neurones de la deuxième zone visuelle du cortex, V2, qui reconnaissent les traits et les petites formes.
Plus haut, vous avez des neurones qui détectent des parties d'objets, puis des objets et des scènes complètes.
Les réseaux de neurones, lorsqu'ils sont entraînés avec des images, peuvent en fait découvrir ces types de niveaux de représentation qui correspondent assez bien à ce que nous observons dans le cerveau.
Les réseaux de neurones biologiques, que vous avez dans votre cerveau, tout comme les réseaux de neurones profonds que nous entraînons sur nos machines, peuvent apprendre à passer d'un niveau de représentation à l'autre, les niveaux supérieurs correspondant à des notions plus abstraites.
Par exemple, la notion abstraite du caractère A peut être rendue de nombreuses manières différentes aux niveaux les plus bas, sous forme de nombreuses configurations de pixels différentes selon la position, la rotation, la police, etc.
Apprentissage supervisé vs autonome
Alors, comment apprenons-nous ces hauts niveaux de représentation ?
Une chose qui a eu beaucoup de succès jusqu'à présent dans les applications de l'apprentissage profond est ce que nous appelons l'apprentissage supervisé.
Avec l'apprentissage supervisé, l'ordinateur doit être pris par la main et l'humain doit lui donner la réponse à de nombreuses questions.
Par exemple, sur des millions et des millions d'images, les humains doivent dire à la machine, eh bien, pour cette image c'est un chat, pour cette image c'est un chien, pour cette image c'est un ordinateur portable, pour cette image c'est un clavier, et ainsi de suite des millions de fois.
C'est très fastidieux et nous utilisons le crowdsourcing pour y parvenir.
Bien que cela soit très puissant et que we soyons déjà capables de résoudre des problèmes très intéressants, les humains sont beaucoup plus forts et peuvent apprendre sur beaucoup plus d'aspects différents du monde d'une manière beaucoup plus autonome, comme nous l'avons vu avec l'enfant de deux ans qui apprend la physique intuitive.
Modèles génératifs et voitures autonomes
L'apprentissage non supervisé pourrait également nous aider à gérer les voitures autonomes.
Laissez-moi vous expliquer ce que je veux dire.
L'apprentissage non supervisé permet aux ordinateurs de se projeter dans l'avenir, de générer des futurs plausibles en fonction de la situation actuelle.
Et cela permet aux ordinateurs de raisonner et de planifier, même pour des circonstances pour lesquelles ils n'ont pas été formés.
C'est important, car si nous utilisions l'apprentissage supervisé, nous devrions indiquer à l'ordinateur toutes les circonstances dans lesquelles la voiture pourrait se trouver et comment un humain réagirait dans cette situation.
Comment ai-je appris à éviter les comportements de conduite dangereux ?
Ai-je dû mourir mille fois dans un accident ?
Eh bien, c'est ainsi que nous entraînons les machines actuellement.
Donc, ça ne va pas marcher, ou du moins ça ne va pas conduire.
Ce dont nous avons besoin, c'est d'entraîner nos modèles à être capables de générer des images plausibles, des futurs plausibles, à être créatifs.
Et nous faisons des progrès dans ce domaine.
Nous entraînons donc ces réseaux de neurones profonds pour passer d'une signification de haut niveau à des pixels plutôt que des pixels à une signification de haut niveau, en allant donc dans l'autre sens à travers les niveaux de représentation.
De cette façon, l'ordinateur peut générer de nouvelles images, différentes de celles qu'il a vues pendant son entraînement, mais qui sont plausibles, qui ressemblent à des images naturelles.
Nous pouvons également utiliser ces modèles pour imaginer des images étranges, parfois effrayantes, tout comme nos rêves et nos cauchemars.
Voici quelques images synthétisées par l'ordinateur à l'aide de ces modèles génératifs profonds.
Elles ressemblent à des images naturelles, mais si vous regardez de plus près, vous verrez qu'elles sont différentes et qu'il leur manque encore certains détails importants que nous reconnaîtrions comme naturels.
L'écosystème de l'IA à Montréal
Il y a environ 10 ans, l'apprentissage non supervisé a été la clé de la percée que nous avons obtenue en découvrant l'apprentissage profond.
Cela se passait dans quelques laboratoires seulement, dont le mien, à une époque où les réseaux de neurones n'étaient pas populaires, ils étaient presque abandonnés par la communauté scientifique.
Maintenant, les choses ont beaucoup changé.
C'est devenu un domaine très prisé.
Il y a maintenant des centaines d'étudiants chaque année qui postulent pour des études supérieures dans mon laboratoire avec mes collaborateurs.
Montréal est devenue la plus grande concentration académique de chercheurs en apprentissage profond au monde.
Nous venons de recevoir une énorme subvention de recherche de 94 millions de dollars pour repousser les frontières de l'IA et de la science des données, et aussi pour transférer la technologie de l'apprentissage profond et de la science des données vers l'industrie.
Les gens d'affaires, stimulés par tout cela, créent des startups, des laboratoires industriels, dont beaucoup à proximité des universités.
Par exemple, il y a quelques semaines à peine, nous avons annoncé le lancement d'une fabrique de startups appelée Element AI, qui va se concentrer sur les applications d'apprentissage profond.
Il n'y a tout simplement pas assez d'experts en apprentissage profond.
Ils reçoivent donc des salaires de folie, et bon nombre de mes anciens collègues universitaires ont accepté des offres généreuses d'entreprises pour travailler dans des laboratoires industriels.
Implications sociales et santé
Pour ma part, j'ai choisi de rester à l'université, de travailler pour le bien public, de travailler avec les étudiants, de rester indépendant, de guider la prochaine génération d'experts en apprentissage profond.
Une chose que nous faisons au-delà de la valeur commerciale est de réfléchir aux implications sociales de l'IA.
Beaucoup d'entre nous commencent maintenant à se tourner vers des applications sociales à valeur ajoutée comme la santé.
Nous pensons pouvoir utiliser l'apprentissage profond pour améliorer les traitements grâce à la médecine personnalisée.
Je crois qu'à l'avenir, à mesure que nous recueillerons davantage de données auprès de millions et de milliards de personnes à travers le monde, nous serons en mesure de fournir des conseils médicaux à des milliards de personnes qui n'y ont pas accès actuellement.
Et we pouvons imaginer bien d'autres applications pour la valeur sociale de l'IA.
Par exemple, l'une des retombées de nos recherches sur la compréhension du langage naturel sera la fourniture de toutes sortes de services, comme des services juridiques, à ceux qui n'ont pas les moyens de se les offrir.
Nous nous tournons également vers les implications sociales de l'IA dans ma communauté.
Mais il ne revient pas qu'aux experts d'y réfléchir.
Je crois qu'au-delà des mathématiques et du jargon, les gens ordinaires peuvent comprendre ce qui se passe sous le capot, suffisamment pour participer aux décisions importantes qui seront prises au cours des prochaines années et décennies concernant l'IA.
Éducation et engagement citoyen
Alors, s'il vous plaît, mettez de côté vos craintes et donnez-vous un peu d'espace pour apprendre à ce sujet.
Mes collaborateurs et moi avons écrit plusieurs articles d'introduction et un livre intitulé Deep Learning pour aider les étudiants et les ingénieurs à se lancer dans ce domaine passionnant.
Il existe également de nombreuses ressources en ligne, des logiciels, des tutoriels, des vidéos, et de nombreux étudiants de premier cycle apprennent par eux-mêmes une grande partie de ces recherches sur l'apprentissage profond pour rejoindre plus tard les rangs de laboratoires comme le mien.
L'IA va avoir un impact profond sur notre société.
Il est donc important de se demander comment nous allons l'utiliser.
D'immenses points positifs peuvent en découler, parallèlement à des points négatifs, tels que l'utilisation militaire ou des changements perturbateurs rapides sur le marché du travail.
Pour s'assurer que les choix collectifs qui seront faits concernant l'IA dans les prochaines années profiteront à tous, chaque citoyen devrait jouer un rôle actif dans la définition de la manière dont l'IA façonnera notre avenir.
Merci.