Mustafa Suleyman

L'évolution de l'IA : De la prédiction au compagnon universel

15 novembre 2024

Intelligence Artificielle
Illustration de Mustafa Suleyman

Origines et progression de l'IA

Mustafa Suleyman

Les gens pensent souvent que cela est apparu de nulle part, mais en réalité, il s'agit d'une progression constante sur 15 ans d'amélioration continue. Nous nous sommes concentrés sur les mêmes quelques objectifs : plus de données, plus de puissance de calcul, des cycles d'entraînement plus importants et la même architecture de base. L'idée que l'on peut représenter des idées complexes avec des réseaux neuronaux et qu'ils peuvent être efficaces pour la prédiction s'est avérée exacte. Cela a été prouvé. C'est la thèse centrale de DeepMind, et de nombreuses autres entreprises la poursuivent depuis longtemps. Ce qui est fou, c'est que cela fonctionne vraiment maintenant. C'est véritablement une méthode polyvalente et très efficace pour prédire à peu près n'importe quoi dans des environnements très complexes. La prédiction est la compétence première de l'intelligence. C'est ce qui fait principalement notre spécificité en tant qu'espèce. Nous sommes très doués pour deviner ce qui pourrait arriver, puis utiliser cette conjecture pour intervenir de manière créative, que nous fabriquions quelque chose de physique, écrivions des logiciels, discutions entre nous ou jouions à un sport. C'est une compétence fondamentale. C'est une période très créative et amusante pour utiliser ce nouvel outil auquel tout le monde a accès.

Points d'inflexion et lois de mise à l'échelle

Mustafa Suleyman

Rétrospectivement, les points d'inflexion sont évidents. AlphaGo était clairement un point d'inflexion. Bien que cela remonte à presque une décennie maintenant, c'était la première application à grande échelle des GPU. Nous n'avions jamais eu de GPU individuels entièrement connectés de cette manière auparavant. C'est l'un des éléments qui a inspiré Jensen et l'a convaincu qu'il était sur la bonne voie. Jensen est incroyablement visionnaire et parie sur les GPU depuis 2012, lorsqu'il a vu l'article sur le neurone du chat. Dans l'apprentissage profond, c'était la première fois que quelqu'un utilisait un réseau neuronal pour reconnaître des chats dans des vidéos. L'un de mes collègues, Andrew Ng, fondateur de Coursera et un enseignant exceptionnel en apprentissage automatique, a indiqué qu'il fallait ces très grands ordinateurs parallèles capables d'exécuter des billions d'opérations par seconde en parallèle pour rechercher la combinaison de pixels correspondant à un chat plutôt qu'à un chien ou un zèbre. Il y a eu une série de percées en cours de route qui ont fait comprendre à tout le monde que la même méthode de base fonctionne et monte en charge. C'est ce qu'on appelle souvent les lois de mise à l'échelle : comment augmenter la puissance de calcul et les données pour améliorer les prédictions. Plus récemment, ce qui m'épate, c'est la qualité des modèles vocaux capables de générer du nouvel audio en temps réel, donnant l'impression d'avoir une conversation. C'est époustouflant. Parfois, on voit une technologie se développer sur une longue période et, même en étant proche d'elle, on est toujours surpris quand elle fonctionne de manière aussi fluide et devient une seconde nature. Ensuite, on la considère comme acquise et tout le monde pense que ce n'est plus intéressant. C'est incroyable d'avoir du streaming vidéo ou de l'enregistrement audio sur ses téléphones.

Surplus technologique et créativité

Mustafa Suleyman

Nous nous trouvons à un moment extraordinaire de l'history de la science, où nous avons plus de percées que nous ne savons en appliquer. Nous avons un surplus technologique. Nous n'avons jamais connu cela dans l'histoire de l'humanité, où la même percée produit de plus en plus d'applications, de produits et de cas d'utilisation semaine après semaine. Il n'y a rien de nouveau à générer le script de deux personnes qui parlent pour produire un podcast ; au lieu d'entraîner un modèle conversationnel, on en ajoute simplement deux et ils parlent à tour de rôle. Cela montre que nous commençons tout juste à découvrir les nombreuses façons dont cette technologie peut être profonde et percutante. C'est une période très créative.

Cas d'utilisation futurs : Éducation, Santé et Copilot

Mustafa Suleyman

Il y aura tellement de cas d'utilisation. Ce sera un enseignant extraordinaire qui vous proposera un programme personnalisé pour vous aider à apprendre n'importe quel sujet qui vous intéresse. Ce sera un médecin extraordinaire à l'avenir, qui vous donnera des conseils médicaux à un coût marginal proche de zéro. Il fournira un coaching médical et de bien-être pour vous aider à respecter votre régime, qu'il s'agisse d'un plan de perte de poids, d'un soutien en santé mentale ou de fitness. Il donnera des conseils créatifs pour rédiger des essais, produire des podcasts, lancer une entreprise ou obtenir des conseils juridiques. Les cas d'utilisation sont infinis. C’est pourquoi nous avons conçu Copilot ; nous le voyons comme une aide qui vous permet d'être la meilleure version de vous-même.

L'importance de la mémoire dans l'IA

Mustafa Suleyman

La mémoire est l'élément critique. Aujourd'hui, chaque fois que vous utilisez votre IA, vous avez une nouvelle session avec une mémoire limitée des conversations précédentes. Parce qu'elle ne se souvient pas des sessions d'il y a dix fois, l'expérience peut être frustrante. On ne s'investit pas profondément et on ne s'appuie pas sur les discussions précédentes car on sait qu'elle va oublier. On finit par abandonner et l'expérience devient plus superficielle. Cependant, nous avons des prototypes avec une mémoire quasi infinie, ce qui est véritablement transformateur. La mémoire est un point d'inflexion car elle signifie qu'il vaut la peine d'investir du temps, puisque tout ce que vous direz sera restitué de manière utile. Vous serez soutenu et conseillé, et avec le temps, cela aidera à planifier votre journée et à organiser votre vie. Cette capacité seule, que je prévois de voir arriver en 2025, sera véritablement transformatrice.

Économie de l'IA et boucle de rétroaction

Mustafa Suleyman

Ce sera coûteux au début, mais comme nous l'avons vu avec la télévision et l'appareil photo, une fois que c'est utile et que les gens peuvent se permettre de fournir des commentaires et de travailler avec, tout le monde finit par en vouloir. Quand tout le monde en veut, les économies d'échelle font baisser les coûts. Aujourd'hui, les meilleurs modèles que nous proposons sur Azure sont 99 % moins chers qu'il y a deux ans. Azure est la meilleure plateforme au monde pour accéder à ces modèles, et je m'attends à ce que cette courbe de coûts baisse encore plus agressivement dans les prochaines années. C'est une boucle de rétroaction étrange : à mesure que le coût du calcul ou des algorithmes baisse, nous en utilisons davantage pour créer des expériences plus complexes, puissantes et créatives. Nous sommes dans ce cycle de calcul depuis presque un siècle, où il devient moins cher et où nous en utilisons davantage. Jusqu'à présent, plus de calcul apporte toujours plus de valeur, rendant les choses plus précises, plus faciles à contrôler et plus exactes. Vous avez une influence stylistique et pouvez le façonner pour qu'il se comporte d'une certaine manière. Ce cycle bénéfique est une boucle de rétroaction incroyable.

Langues, données et apprentissage par le retour utilisateur

Mustafa Suleyman

Pas encore. Pour l'instant, c'est plus fiable en anglais, dans certaines langues européennes et en espagnol. Mais avec le temps, il n'y a aucune raison pour que la longue traîne des 120 langues en Inde, ou des 5 500 dialectes, ne soit pas disponible d'ici trois à cinq ans. La même méthode a déjà prouvé son efficacité dans d'autres langues. C'est juste une question de temps et de numérisation. On a besoin de moins en moins de données une fois que le modèle principal est construit, car il s'appuie sur le noyau linguistique. Je ne pense pas que les données seront une limitation majeure. De plus, plus les gens l'utilisent, plus ils fournissent implicitement des commentaires. S'ils terminent une session, cela peut être un signal. S'ils disent que quelque chose n'a pas de sens ou est faux, nous apprenons de ce retour. C'est pourquoi plus les gens l'utilisent, meilleur il devient.

L'importance du marché indien

Mustafa Suleyman

Copilot se développe rapidement en Inde. C'est un marché énorme pour nous qui nous enthousiasme beaucoup, en partie grâce aux incroyables travailleurs du savoir et développeurs. Les personnes bilingues ou multilingues ont été impatientes d'adopter de nouvelles technologies et sont très ouvertes d'esprit. C'est l'un de nos marchés à la croissance la plus rapide. Certaines de mes meilleures équipes sont à Hyderabad et dans d'autres villes. Nous avons d'importantes équipes d'ingénierie et de recherche. Certains des impacts les plus importants que nous ayons eus pour améliorer la qualité des résultats de recherche de Bing proviennent d'ici. C'est pourquoi je viens ici ; c'est un centre de développement crucial pour nous.

Copilot comme compagnon conversationnel

Mustafa Suleyman

Considérez-le comme un compagnon conversationnel à qui vous pouvez poser n'importe quelle question, à tout moment, avec votre propre style et à votre propre rythme. Il n'a aucun jugement et ne devient jamais frustré, en colère, ennuyé ou fatigué. Il est toujours disponible pour reformuler n'importe quelle question ou problème selon votre niveau. Il est totalement réactif à ce dont vous avez besoin.

L'évolution de la communication homme-machine

Mustafa Suleyman

Nous menons un effort considérable avec Copilot pour le travail, M365 Copilot. Il vous aide à reformuler des e-mails, à organiser votre calendrier et à rédiger des documents créatifs dans Microsoft Word ou Excel. Avec le temps, il deviendra un dépanneur. Si vous êtes sur votre machine Windows et que vous êtes bloqué par un réglage, il travaillera avec vous en temps réel, voyant ce que vous voyez sur votre bureau ou votre téléphone portable. C'est un moment de transition clé. Aujourd'hui, vous devez communiquer explicitement avec votre ordinateur par des mots ou des boutons, alors que demain, vous ferez simplement une référence. Vous direz 'ceci' ou 'cela' ou 'regarde là'. Ce sera comme avoir un compagnon à vos côtés, ce qui est un plan de communication différent. Chaque nouvelle vague de technologie ouvre un nouveau plan de communication. La radio a ouvert la diffusion de un vers plusieurs ; la télé a ouvert des milliers de chaînes ; l'internet a ouvert la communication de tous vers tous. Chaque mode technologique vous permet de penser, d'agir et de parler d'une manière totalement différente. Vous allez pouvoir exprimer des idées que vous ne saviez même pas avoir parce qu'une nouvelle modalité est à votre portée. Avoir un compagnon omniprésent qui voit ce que vous voyez et entend ce que vous entendez en temps réel sera profondément différent. Tout comme l'écran tactile a été une différence profonde, vous apprenez une nouvelle façon subconsciente d'essayer de façonner votre monde numérique car vous avez un nouvel outil à votre disposition. Ce sera un changement majeur d'avoir toujours ce compagnon disponible pour les questions, la créativité et la curiosité.

Empathie et fluidité de l'IA

Mustafa Suleyman

C'est profondément empathique — je pense plus que les humains. Il est fluide dans la conversation, détendu et peut gérer les interruptions. Il peut être patient quand il doit vous laisser parler et offre une écoute active. C'est une façon différente de parler aux ordinateurs, ce qui est un changement énorme.

Le raisonnement et la chaîne de pensée

Mustafa Suleyman

Il y a trois ans, il n'y avait aucun raisonnement d'aucune sorte. On posait une question et il donnait la meilleure réponse possible. Aujourd'hui, nous avons des modèles qui, avant de donner une réponse, génèrent de nombreuses possibilités dans leur propre mémoire de travail. Le modèle classe ces réponses pour déterminer si elles répondent aux besoins de l'utilisateur, qu'elles soient précises ou divertissantes. Il peut effectuer une 'chaîne de pensée' où il réfléchit dans sa propre tête, ce qui est une forme de raisonnement. Il peut faire cela jusqu'à 100 fois en quelques secondes avant de produire une réponse. Cela permet au modèle de réfléchir et d'évaluer la qualité de sa réponse, en itérant avant de produire le résultat. Il raisonne en réfléchissant à un problème étape par étape, ce qui est assez différent de ce qui se faisait auparavant.

L'avenir pluridisciplinaire et l'intelligence collective

Mustafa Suleyman

L'important est d'avoir l'esprit ouvert, d'accueillir la possibilité et d'être pluridisciplinaire. Les futurs individus à fort impact seront capables de parler plusieurs langages techniques et sociaux et d'opérer à l'intersection des disciplines. La spécialisation reste importante, mais il faut avoir à la fois la spécialisation et la largeur de vue, car nous vivons désormais dans un monde d'échange d'informations de tous vers tous. De nombreux jeunes créateurs en ligne aujourd'hui sont doués pour le codage, l'utilisation de nouveaux outils et le design. Ils peuvent réaliser des courts-métrages et de la musique. Tout le monde devient pluridisciplinaire parce qu'ils apprennent de ce que font tous les autres en temps réel. C'est presque comme si l'intelligence collective de l'espèce humaine décollait. Elle devient plus performante car nous apprenons tous les uns des autres dans cette intelligence collective. C'est remarquable, et cela provient de la connectivité de tous vers tous et de la réduction de la barrière d'accès aux outils qui nous rendent plus intelligents.