Satya Nadella sur l'IA, la culture de Microsoft et le commerce agentique
18 novembre 2025
Technologie et Intelligence Artificielle
Vision de Bill Gates et durabilité d'Excel
Bill a toujours été obsédé. Je me souviens distinctement qu'il disait cela dans les années 90. Il disait qu'il n'y avait qu'une seule catégorie dans le logiciel. Elle s'appelle la gestion de l'information. Il faut schématiser les personnes, les lieux et les choses, et c'est tout.
Le problème, c'est que les gens sont désordonnés.
Les gens sont-ils fidèles à un modèle ou à une marque d'IA ?
Vous voulez un ensemble de modèles. Vous avez des agents qui servent d'intermédiaires à cet ensemble pour qu'il réponde à vos besoins.
La préférence de chacun ne sera-t-elle pas simplement pour plus d'intelligence ? J'irai dans le sélecteur et choisirai manuellement O3 pour une requête type 'où devrais-je aller chercher une glace'.
Oh oui.
C'est un rite de passage pour certaines entreprises de logiciels que d'essayer de s'attaquer à Excel. Pourquoi est-il si durable ?
On ne lui accorde pas assez de crédit. Je peux lui faire tout faire.
C'est l'environnement de programmation le plus accessible au monde.
À 100 %.
Et Peter, ici, c'est qui ?
Peter, c'est Peter Levels. C'est un indé-
Je connais Peter Levels. Je le connais.
Satya, tu es tellement connecté. Satya sait qui est Peter Levels. C'est pour ça que Microsoft est une entreprise à 14 billions de dollars.
Y avait-il des choses intéressantes à voir au centre de données ?
C'est l'endroit le plus amusant où aller.
Satya Nadella a pris la direction de Microsoft en 2014, mais il travaille dans l'entreprise depuis plus de 30 ans et a vu beaucoup de choses. Microsoft a décuplé sa taille sous la direction de Satya, et on lui attribue le succès de Microsoft, d'abord dans le cloud et maintenant dans l'essor de l'IA.
Santé John, c'était super.
L'IA dans l'entreprise et la conférence Ignite
Alors, qu'est-ce qui devrait enthousiasmer les gens à Ignite ?
La conférence Ignite est pour nous, avant tout, l'occasion de s'assurer que l'IA se diffuse au sein de l'entreprise. S'il y a une chose, c'est qu'il s'agit moins d'admirer l'usine d'IA ou l'agent d'IA d'un autre, mais d'apprendre à construire sa propre usine d'IA. L'organisation de la couche de données s'avère probablement être la chose la plus compliquée qui traverse l'entreprise de manière à ce qu'elle puisse répondre à l'intelligence. C'est ce sur quoi nous allons probablement travailler beaucoup.
Nous n'avons toujours pas vraiment de recherche approfondie dans un contexte d'entreprise.
Si, c'est tout l'enjeu de Copilot.
Mais la plupart des gens, au quotidien, ne l'ont pas. Alors, sous-utilisent-ils simplement l'IA qui existe ?
En fait, c'est intéressant que vous l'évoquiez car pour moi, c'est la fonctionnalité clé. La chose la plus importante que nous ayons faite a été de prendre ce graphe qui se trouve sous ce que je considère comme la base de données la plus importante de toute entreprise. Il se trouve sous vos e-mails, vos documents, vos appels Teams, etc. Ce sont les relations où les gens ne travaillent pas de manière ad hoc et non structurée, mais en relation avec un événement commercial. Cette connexion sémantique est dans la tête des gens et elle se perd. Pour la première fois, il y a une bien meilleure capacité de rappel.
Pourquoi pensez-vous que c'est sous-exploité dans l'entreprise ? Car j'ai l'impression que les gens utilisent beaucoup d'outils LLM, qu'ils téléchargent des documents individuels, mais je ne pense pas que la plupart des entreprises disposent d'une IA quotidienne branchée sur tout le contexte de l'entreprise, capable de tout voir et de tout faire.
Ça commence. Je dis toujours qu'au moins par rapport à tout ce que nous avons fait en termes de suites Office au cours de notre histoire, c'est ce qu'il y a de plus rapide. Parce que c'est de la gestion du changement. Au bout du compte, il faut l'intégrer, les gens doivent l'utiliser. Dans un cadre d'entreprise, cela signifie que toute la découverte électronique doit fonctionner, toute la gouvernance des données doit fonctionner. Nous avons dû intégrer Purview dans Copilot de sorte que chaque fois que j'essaie de récupérer quelque chose de confidentiel, ce soit étiqueté confidentiel, géré par IRM, etc. Il y a eu une quantité de travail importante et c'est là que nous commençons à voir une progression. L'autre chose que je dirais, c'est que c'est une chose de le faire fonctionner à travers le graphe Microsoft 365, mais l'étape suivante, c'est qu'en est-il de votre système ERP ? Les connecteurs fonctionnent un peu, mais pas vraiment parce qu'ils sont trop limités. Vous avez juste besoin d'une bien meilleure architecture de données où vous devez essentiellement intégrer sémantiquement tout cela dans une seule couche.
Infrastructure de données et information à portée de main
Il existe depuis des décennies une vision consistant à avoir les données de votre entreprise à portée de main. Mon exemple préféré est le livre Softwar sur l'histoire d'Oracle, qui raconte que Larry Ellison faisait des EBC au Japon à la fin des années 1990, et qu'il présentait aux dirigeants toutes les données de l'entreprise en un seul endroit. Une partie de la raison pour laquelle cet argumentaire est éternel est que les entreprises n'ont pas réellement toutes leurs données à portée de main. Les entreprises ne mangent pas leurs légumes d'infrastructure de données. L'argumentaire auprès des dirigeants est toujours : vous pouvez répondre vous-même à vos questions en appuyant sur un bouton au lieu d'envoyer une demande à un analyste qui mène une enquête pour vous. Allons-nous enfin, cette fois-ci, nous occuper de notre plomberie de données ? Vous pouvez contester le principe, mais c'est ma question.
Je pense que Bill a inventé ce terme 'l'information à portée de main' lors d'un discours au Comdex dans les années 90. Bill a toujours été obsédé par... Je me souviens distinctement qu'il disait cela dans les années 90, ce que j'ai capté lors d'une des revues auxquelles je participais en tant que junior, et il disait qu'il n'y avait qu'une seule catégorie dans le logiciel. Elle s'appelle la gestion de l'information. Il faut schématiser les personnes, les lieux et les choses, et c'est tout. Vous n'avez rien besoin de faire de plus parce que tout logiciel... et c'était le rêve que Bill avait toujours, où il voulait, par exemple, il détestait les systèmes de fichiers parce qu'ils n'étaient pas structurés. Il aurait adoré que tout soit une base de données SQL et qu'il puisse simplement faire des requêtes SQL et programmer contre toute l'information. C'était pour lui une solution élégante pour l'information à portée de main. Le problème, c'est que les gens sont désordonnés et même si les données des personnes sont structurées, elles ne sont pas vraiment disponibles dans un seul index, ou une seule requête SQL que je peux exécuter contre tout cela. Cela a été le défi fondamental de l'ancien monde. Je n'aurais pas pensé que cette chose de l'IA et un réseau neuronal profond avec une certaine mise à l'échelle deviendraient soudainement ce qui déchiffre les modèles, et non un modèle de données schématisé. Pendant très longtemps, nous avons toujours été obsédés par la complexité que les relations ou le modèle de données devaient avoir pour capturer l'essence d'une entreprise. Il s'avère qu'il s'agit de beaucoup de paramètres dans un réseau neuronal avec beaucoup de puissance de calcul.
Modèles d'IA, mémoire et capacité d'action
Dwarkesh parle de cet employé à distance intelligent qui a commencé il y a cinq minutes, soulignant le fait que les modèles peuvent être arbitrairement intelligents et qu'ils peuvent faire du RAG et avoir accès à tout dans votre entreprise, mais ce n'est pas tout à fait la même chose que si le modèle savait réellement quelque chose en tant que modèle. À moins de former des modèles personnalisés au sein de votre entreprise, les modèles ne peuvent pas réellement devenir plus intelligents dans ce que vous faites, et la millième requête n'est pas plus intelligente que la première. Où pensez-vous que cela nous mène ?
Je pense qu'il y a deux choses. Tout est question d'apprentissage en contexte ou d'apprentissage continu. Cela renvoie à ce que je disais : si vous avez le cœur cognitif du modèle séparé de ses connaissances, alors vous avez essentiellement la formule d'apprentissage continu ou l'algorithme et vous n'avez plus qu'à le libérer. Il y a au moins trois choses en dehors du modèle au moment de l'exécution que je pense qu'il faut résoudre. L'une est la mémoire et toutes les formes de mémoire, à court et à long terme. Même ces grands défis des humains sont excellents pour l'attribution de crédit à long terme. Quelqu'un m'a dit le jour où les modèles d'IA pourront à la fois récompenser et se souvenir comment punir pour une erreur parce qu'ils ont la capacité de faire de l'attribution de crédit à long terme, c'est là que vous saurez qu'ils ont une vraie mémoire. La mémoire en est une. Le second, ce sont les droits d'accès. Ils doivent vraiment respecter tout le système d'autorisation au moment de l'exécution parce qu'il y a des rôles, quels accès ai-je, et le modèle doit répondre à cela. Ensuite, l'espace d'action doit tout à fait fonctionner. Si vous apportez ces trois choses parce que c'est l'environnement. Si j'ai des actions, des droits et de la mémoire avec ces modèles, et qu'ils doivent par définition être à l'extérieur du modèle mais intégrés au modèle. C'est là que la frontière doit se déplacer. Par exemple, sur Copilot aujourd'hui, vous utilisez les modèles d'OpenAI, vous utilisez même Claude. J'ai besoin que le système fonctionne sur les deux.
Routine quotidienne et leadership chez Microsoft
J'ai un million d'autres questions sur l'IA, mais je veux vous poser quelques questions sur votre façon de travailler. À quoi ressemble votre quotidien ? Et en particulier, comment gérez-vous en vous déplaçant ? Dans quels couloirs virtuels errez-vous pour avoir une idée de ce qui se passe chez Microsoft ? À quoi ressemblent réellement vos engagements clients pour une journée normale, pas pour les résultats ou une réunion du conseil d'administration ?
Assez curieusement, ma journée normale se situe aux deux extrémités de celle-ci, les trucs clients. Il n'y a pas un jour où je n'ai pas d'appels Teams pendant la majeure partie de la journée, au moins deux ou trois avec un client. C'est le moyen le plus utile pour moi de garder les pieds sur terre. J'en ai au moins un ou deux chaque jour. Ensuite, il y a beaucoup de temps de réunion. En tant que PDG, l'une des choses que j'ai reconnues est qu'il y a deux types de réunions. Une réunion est celle où je suis censé convoquer et me taire parce que la convocation était la chose réelle. C'est comme : ne surperformez pas, asseyez-vous simplement parce que tout le travail aura déjà eu lieu ou aura lieu après. Et puis l'autre réunion, qui sont les réunions importantes où j'ai besoin d'apprendre ou de prendre une décision ou de communiquer quelque chose. Les réunions sont un autre point. Ensuite, je suis partout sur les canaux Teams. Je traîne sur les canaux Teams et ils sont très utiles. En fait, c'est là que j'apprends le plus, que je rencontre le plus de gens. Parcourir les couloirs, j'aimerais pouvoir vous dire que c'est la forme-
Teams est la nouvelle façon de parcourir les couloirs, en regardant ces canaux.
À 100 %. C'est là que je crée le plus de liens. J'apprends à connaître qui est la personne qui travaille sur l'agent Excel. J'en retire bien plus que de tout ce que j'ai fait d'autre.
Alors, les équipes chez Microsoft travaillent-elles sur leur produit et puis Satya surgit et pose une question sur leur produit ?
En partie. Parfois, j'ai l'impression que nous sommes beaucoup trop cloisonnés par des autorisations. J'aimerais avoir plus d'accès parfois. Ma plus grande plainte est de ne pas pouvoir passer partout où je veux. Mais oui, c'est amusant de pouvoir juste entrer là-dedans, cela normalise les choses et les gens n'hésitent pas non plus à partager leur opinion avec vous.
Connexion avec les startups et les développeurs
J'ai remarqué. Vous êtes célèbre, du moins dans certains coins de la Valley, pour rester très connecté à ce qui se passe dans la tech ici. Je me souviens que vous avez visité les bureaux de Stripe quand nous étions une minuscule entreprise. Je veux dire, nous étions probablement juste après votre prise de fonction en tant que PDG, je suppose, mais Stripe était très petit et Microsoft était très grand.
En fait, avant. La première fois que je suis venu dans vos bureaux, c'était quand je dirigeais Azure d'abord.
D'accord, cétait donc même avant cela. Cela devait être au tout début du parcours de Stripe. Pourquoi pensez-vous faire cela beaucoup plus que la plupart des autres PDG ? Parce que d'autres PDG devraient aussi vouloir rencontrer toutes les startups.
J'ai grandi chez un Microsoft qui avait ce gène des relations développeurs, de l'évangélisation en moi. J'aborde une grande partie de cela comme si vous ne suiviez pas les développeurs, il y a deux types de choses qui sont ancrées en moi. L'une est que si vous ne suivez pas où vont les développeurs, il est difficile d'être pertinent en termes de plateformes technologiques. Et ensuite, vous devez vraiment comprendre la nouvelle charge de travail afin de construire la plateforme technologique. Ce sont les deux choses que j'ai gardées. Si vous ne suivez pas les startups, il est très difficile de savoir ce qu'est la plateforme ou la charge de travail. C'est une chose vers laquelle j'ai indexé. L'autre chose est que j'en retire tellement d'énergie. J'ai toujours pensé que les fondateurs étaient des gens magiques qui créent quelque chose à partir de rien. Cela ressemble à un tour de magie. J'aime toujours comment on fait cela.
C'est drôle que vous disiez cela à propos du suivi de ce que font les startups. Nous avons toujours conçu ce que Stripe construisait comme s'il était important de construire pour les startups à la fois parce que les petites startups d'aujourd'hui sont les entreprises publiques de demain et nous l'avons vu maintes et maintes fois chez Stripe, mais nous sentions juste à un niveau intuitif que ce qui intéressait les startups était souvent de meilleures expériences produit. Si les startups veulent des stablecoins ou une facturation basée sur l'utilisation, nous devrions construire pour ces besoins non seulement parce que nous aurons une bonne activité de startup, mais aussi parce que les entreprises finiront par suivre. Il nous a fallu de nombreuses années pour prouver ce modèle, mais maintenant nous voyons vraiment-
Je pense que vous êtes un peu une référence sur ce point. L'une des choses que j'ai apprises de vous était cette idée de redécouvrir ce en quoi Microsoft était très bon, c'est-à-dire suivre le développeur, être là où sont les startups. Et c'est ce qui m'a conduit même vers GitHub et Nat et tout le reste. Évidemment, GitHub était un atout formidable, nous devions être de bons intendants d'un écosystème open source, mais c'est aussi l'endroit où chaque startup a ses dépôts. J'avais l'impression qu'être dans cette boucle était important pour nous, pas seulement stratégiquement pour avoir une position là-bas, mais pour apprendre. Construire un meilleur produit est bien dit car parfois on perd l'esthétique de ce qui est requis, cette façon sans friction de livrer parce qu'il y a moins de patience et que le temps de valorisation doit être maximisé.
Interfaces utilisateur générées et l'avenir des IDE
Microsoft réfléchit-elle à des interfaces utilisateur générées et personnalisées ? Quand on y pense, le logiciel est bloqué dans le vieux paradigme consistant à écrire un tas de logiciels, qui passent en version finale et sortent sur disques. Maintenant, ce même logiciel est livré dans le cloud, mais l'interface utilisateur que vous voulez est probablement, nous pourrions rendre cette interface exacte en temps réel. Est-ce une direction que vous prenez ?
Je pense que oui. À un certain niveau, ce qui se passe, c'est que d'un côté notre capacité à générer, si vous dites que vous pouvez générer tout le code, alors vous pouvez générer un échafaudage d'expérience utilisateur autour de n'importe quoi qui soit beaucoup plus personnalisé. Surtout, pendant très longtemps, l'une des questions chez Microsoft était quelle est la différence entre un document, un site web et une application ? Vous pouvez générer l'un de ceux-là à tout moment selon le format que vous voulez présenter. Mais en même temps, malgré tout ce qu'on dit sur la disparition de ces applications, prenez même nos bons vieux IDE. Dans un sens, les IDE sont de retour, que ce soit Excel ou VS Code parce que l'IA génère des résultats. J'ai besoin de donner du sens à ces résultats. En fait, j'ai besoin d'un éditeur fantastique qui me permette de faire des comparaisons de versions et des itérations dessus avec l'IA. L'IDE, l'une des choses les plus excitantes est de nouvelles classes d'IDE hautement raffinés qui ont une boucle de télémétrie avec la couche d'intelligence, mais qui agissent aussi davantage comme des affichages tête haute. J'ai des milliers d'agents qui se lancent. Comment vais-je donner du sens au micro-pilotage de milliers d'agents ? C'est ce que seront les IDE, les boîtes de réception et les outils de messagerie. Je n'envoie pas de messages ou je ne gère pas le tri comme je le fais aujourd'hui, mais ce sera différent.
Donc vous pensez qu'à l'heure actuelle, les programmeurs passent tout leur temps dans un IDE, mais ils sont l'une des rares professions à le faire. Et votre vision est l'IDE du comptable, l'IDE de l'avocat et-
Quelle est la métaphore de la façon dont nous travaillerons avec les agents ? C'est comme une délégation macro massive. Il y a beaucoup d'agents auxquels je donne un tas d'instructions et ils partent travailler parfois pendant des heures ou des jours. Mais ils font des points d'étape et c'est donc de la macro-délégation et du micro-pilotage. Où et comment fait-on du micro-pilotage avec du contexte ? Cela ne peut pas revenir comme le mien, cela ne peut pas être dans l'enfer de la prochaine notification. Cela me prévient en quelque sorte, il y a genre cinq mots, je ne sais pas exactement quel est le contexte réel. C'est là, je pense, et cela doit ressembler à du multi-applications. C'est là que j'ai l'impression que tout logiciel, quand il devient grand, finit par ressembler à une boîte de réception, un outil de messagerie et un canevas avec un écran clignotant. Sauf que cette fois-ci, beaucoup de travail a été accompli.
Est-ce une seule application ? Est-ce 10 applications différentes ? C'est intéressant si vous pensez à la suite de productivité qui a émergé, il y avait trois grandes applications avec Word, Excel et PowerPoint, mais il est intéressant que ce nombre ne soit pas un et ne soit pas 40, c'était trois. Comment voyez-vous cela ?
Pour moi, il y en aura quelques-unes. En fait, la personne réductionniste en moi dit que ce seront les mêmes choses. Sauf que le travail qu'elles font sera différent. Je pense à un tableau, du moins au niveau humain. Parce qu'on peut parler des outils que les agents utiliseront pour communiquer entre eux. C'est autre chose. En ce moment, pour la boucle d'apprentissage par renforcement (RL), ils simulent notre environnement de production. Mais ils seront ultimement plus efficaces pour créer leurs propres environnements de production pour s'auto-former par renforcement. Mais laissons cela de côté. Pour communiquer avec nous, j'ai l'impression que nous avons découvert de bonnes choses que nous aimons. Nous aimons les feuilles de calcul et les tableaux et nous aimons les documents sous forme linéaire. Nous aimons les boîtes de réception ou les outils de messagerie. Ce sont des interfaces raisonnables. Sauf que la question que vous avez posée est de savoir comment cette chose, lorsqu'elle apparaît dans un IDE avec un ensemble de changements, doit m'aider plus que de simplement dire : d'accord, voici maintenant un fichier, allez à ce fichier. Ce plan dirigé non seulement pour exécuter, mais pour que je fasse mon flux de travail. L'une des choses que nous expérimentons avec ce centre de contrôle dans GitHub Copilot est cela. L'idée est que vous ayez cinq ou six branches différentes dans lesquelles vous lancez tous ces agents autonomes, ils font tous leur travail, ils reviennent et ensuite votre capacité à faire le tri des pull requests (PR) est l'endroit où je pense que le prochain IDE est né.
Leçons de l'histoire : Internet et l'autoroute de l'information
Je suis frappé de voir à quel point, dans la technologie, on voit fréquemment le schéma d'un enthousiasme et d'une vision autour d'une technologie arrivant bien plus tôt que la technologie elle-même ne soit prête. Comme le film '2001, l'Odyssée de l'espace', qui date des années 60, c'était une IA activée par la voix avec des capacités d'utilisation d'outils.
C'est vrai.
Et cela a pris 50 ans. Ensuite, les gens étaient enthousiasmés par l'idée que l'on pourrait parler à son ordinateur et la synthèse vocale, la reconnaissance vocale. Les gens étaient enthousiasmés par cela dans les années 80 et ce n'est que maintenant que c'est enfin vraiment bon, mais ce n'était pas bon il y a trois ans, 40 ans après la vision.
C'est fou que vous évoquiez cela. En fait, j'avais un appartement juste à côté de l'ancien campus de Microsoft, et je travaillais sur la télévision interactive en 94.
Les autoroutes de l'information.
En fait, il y avait plusieurs choses qui étaient stupéfiantes. Ma chaîne de commandement était Rick Rashid qui rapportait à Craig Mundie qui rapportait à Nathan Myhrvold et il y avait Bill Gates. Je me disais que ça faisait beaucoup de QI. Bien sûr, nous avons tous raté Internet. C'était la seule chose qui soit arrivée. Mais j'avais la télévision interactive, l'ATM commuté chez moi, dans mon appartement. Je me souviens d'avoir fait cette démo, l'une des choses à enjeux élevés que j'ai faites en tant que jeune chez Microsoft était une démo de notre premier système de fichiers redondant qui était un serveur vidéo où John Malone est venu et Bill disait : hé, voici l'avenir de la télévision interactive et c'est même génial parce que le disque peut dérailler et le flux continuera. Mon travail consistait à retirer le lecteur de disque et à faire en sorte que le flux continue. Nous avons construit essentiellement un système de fichiers distribué et un serveur de streaming et avions un réseau commuté ATM vers la maison et j'avais cinq films que je pouvais regarder et je les ai tous regardés plusieurs fois.
Je veux vous poser une question à ce sujet parce que j'y ai beaucoup réfléchi et vous êtes la personne idéale à qui demander. Microsoft a vu l'avenir d'Internet qui arrivait dans les années 90. En particulier, la célèbre note de Bill Gates sur le raz-de-marée Internet disait qu'Internet était la seule grande chose sur laquelle Microsoft devait se concentrer. Ce n'était pas la priorité numéro sept sur 15, c'était genre : hé les gars, écoutez bien, la seule chose à laquelle Microsoft devrait penser est Internet. Mais la vision d'Internet à l'époque était cette autoroute de l'information qui était subtilement différente d'Internet parce que la réflexion était que personne n'a Internet sur l'ordinateur à la maison, beaucoup de gens n'avaient pas d'ordinateur à la maison. Ce que les gens ont, c'est une télévision et ce qu'ils ont, c'est le câble qui est une connexion à large bande. Nous allons donc faire ces boîtiers décodeurs sur la télé et c'est ainsi que les gens utiliseront Internet. Accorder une attention énorme à cette vague déferlante, solution assez sensée et bien pensée et pourtant pas la bonne approche. Évidemment, j'évoque cela dans le contexte du géant de l'IA, qu'est-ce qu'on devrait en retirer ?
Ma lecture de l'histoire est que nous avons en quelque sorte compris Internet mais pas tout à fait parce que nous voulions livrer la qualité. Je ne pense pas que nous croyions que le TCP/IP fonctionnerait. À un certain niveau, l'autoroute de l'information, quand je regarde ce que nous essayions de faire, c'était que cette qualité de service était importante, que ce TCP/IP n'allait pas fonctionner et donc nous étions en concurrence contre AOL sur le bas débit et même ça, MSN était un réseau X.25 dans sa première version. Mais c'est là que Bill a pivoté. Ce que Bill a fait, c'est qu'en 95, en fait c'est drôle que Windows 95 était en train de se lancer et puis il dit : vous savez quoi, tout va changer. Entre 92, date à laquelle je pense que nous avons eu notre première démo, et 93, date du lancement de Mosaic. De 93 à 95, il y a eu cette période de deux ans où l'on ne savait pas si cela allait être le protocole et la pile complète, et la pile a émergé. En 95, c'était clair et alors nous avons pivoté.
Intéressant. Donc à cette époque, il n'était pas vraiment clair que l'Internet ouvert l'emporterait.
Oui. En fait, il y a une leçon de plus parce que je pense que nous pouvons transposer cela à l'IA. La première est de bien définir le paradigme. Ensuite, il n'est pas certain, même si vous avez le bon paradigme, que vous n'obtiendrez pas l'application phare ou même le modèle économique. Avec Internet, qui aurait cru que pour le web ouvert, une couche d'organisation serait un moteur de recherche propriétaire ou à effet de réseau ? Parce que la couche d'organisation du web, je dis toujours qu'il n'y a pas de web ouvert, il y a le web Google parce qu'ils l'ont tout simplement dominé.
Devrait-on réfléchir au fait qu'il y avait peut-être une certaine pensée intéressée autour de 'notre solution propriétaire, la joint-venture Liberty Media Microsoft va gagner', alors que c'est le web ouvert qui a gagné, et vous devriez peut-être mettre en garde les organisations où si elles suivent deux possibilités, notre système propriétaire d'autoroute de l'information ou le web ouvert, les entreprises auront d'une manière ou d'une autre une pensée optimiste envers la solution propriétaire.
C'est un point intéressant. Quand je regarde en arrière, AOL et MSN ont perdu face au web ouvert. Sauf qu'ils ont été remplacés par de nouvelles formes d'AOL et de MSN. On les appelle des moteurs de recherche, on les appelle des magasins d'applications. Le web mobile est en fait fascinant.
Le web ouvert était un moment de l'histoire.
Un moment de l'histoire et donc la chose méta pour moi est que des couches d'organisation émergeront toujours, même dans un écosystème ouvert. Une grande partie de la puissance de la catégorie se déplace vers cette couche d'organisation. On ne sait jamais quel est le dernier paradigme, les moteurs de recherche, aujourd'hui ce sont les chatbots. Combien de temps cela durera-t-il ? Personne ne le sait. Mais le succès de ChatGPT ne peut être nié en termes de ce qu'il signifie en tant que point d'agrégation. Les places de marché et les magasins d'applications ont été une réalité. Ce qui vient ensuite, ce qui arrive au commerce électronique dans une place de marché agentique, dans le commerce agentique ? Ce sont les choses intéressantes qui doivent être débattues.
L'IA : Bulle ou révolution infrastructurelle ?
Je veux parler de cela et je veux parler du commerce, mais d'abord pendant que nous sommes sur le sujet des années 90, tout le monde fait des comparaisons avec la bulle Internet en ce moment. C'est presque un cliché. Je pense que c'est une comparaison raisonnable : il s'agit d'un déploiement très intensif en capital pour un nouveau paradigme qui est important et pourtant il y a énormément de dépenses d'investissement. Vous étiez chez Microsoft pendant la bulle Internet de 2000 et le cours de l'action de Microsoft a atteint son sommet à la fin des années 90 ou au début des années 2000 et ne l'a pas dépassé avant 2016. Qu'avez-vous ressenti en 1999 ? Et en particulier, saviez-vous que vous étiez dans une bulle ou vous disiez-vous 'cette fois c'est différent' ?
Nous sommes probablement devenus l'entreprise à la plus forte capitalisation boursière en 2000. Nous avons dépassé GE. Nous étions peu gourmands en capital à l'époque, c'était comme... j'étais plus comme Sam à l'époque, c'est-à-dire que le capital de quelqu'un d'autre était dépensé. Il était clair que la tendance séculaire était évidente, que cela allait arriver parce que même à cette époque, les modèles économiques émergeaient également. Même pour Microsoft, la plus grande leçon à l'époque a été 'mon dieu', même notre premier coup consistant à dire 'nous devons construire un navigateur, nous devons construire un serveur web, nous devons avoir des protocoles Internet partout', nous avions un constructeur de site web dans Office avec FrontPage. Nous avons fait toutes les choses évidentes, mais nous avons réalisé que faire juste les choses évidentes n'avait pas de sens. Nous devions réinventer ce que nous faisions et savoir quels étaient les nouveaux modèles économiques était clair. Ce cycle est donc arrivé de nulle part. Il est né d'une exubérance irrationnelle, mais la correction a en quelque sorte balayé un tas de choses, mais je dirais que les idées ont persisté. Je pense à ce qui se passe ici. Il y a deux choses, l'infrastructure elle-même qui est en train d'être déployée. Je pense que c'est beaucoup plus immédiat. Ce n'est pas comme la période de gestation de la construction de la fibre noire qu'une entreprise Internet finira par exploiter pour atteindre un milliard d'utilisateurs. Cette fois, les gens font la queue pour acheter ce matériel.
Exactement.
Donc cette fois-ci, nous sommes en retard. Ce n'était pas comme ça à l'époque quand je regarde notre construction d'infrastructure et la demande d'aujourd'hui. C'est ça le truc, quand les gens disent que c'est une bulle, quand je regarde mes résultats, quand est-ce que j'ai été pour la dernière fois à ce point limité par l'offre en termes de capacités de calcul ?
Je n'avais jamais entendu cette comparaison auparavant : la bulle Internet qui, encore une fois, était une bulle des télécoms, était une bulle de la fibre de manière importante. C'était de la fibre noire. C'était dans le nom, c'était 'noir', ce n'était pas encore éclairé et ici c'est tout sauf de la fibre noire.
Oui, ce n'est pas comme si l'un d'entre nous restait assis là en disant : hé j'ai tous les GPU câblés et personne ne les utilise. Je n'ai pas de problème d'utilisation. Je peux avoir un... je veux une utilisation plus élevée parce qu'il s'agit principalement d'un goulot d'étranglement de mémoire ou autre, mais il n'y a pas une chose que j'ai qui n'est pas vendue. En fait, mon problème est que je dois apporter plus d'offre. Et dans tout cela, y arriverons-nous parfaitement ? Personne n'y arrive. Il n'y a aucune opération de chaîne d'approvisionnement qui corresponde parfaitement à l'offre et à la demande. Mais cette fois-ci, le déploiement, étant donné le long délai, par exemple une des choses que nous étudions beaucoup est même quand nous parlons de notre capital, nous essayons de le décrire même au marché. Hé, vous devez vous rappeler que ces actifs, certains de ces actifs sont sur 20 ans. Certaines de ces choses sont sur quatre ou cinq ans. Vous devez prendre les décisions différemment sur ces choses. Avoir une coque vide inutilisée n'est rien. C'est comme avoir un campus avec cinq bâtiments. Ce ne sera pas un problème pour le bilan de Microsoft. Notre vrai problème serait de ne pas avoir de coques prêtes que nous pourrions activer.
Où se situe le goulot d'étranglement ces jours-ci ? Est-ce les électriciens, les coques, les turbines ?
Le produit qui constitue le goulot d'étranglement est juste un ensemble de coques alimentées en énergie. Si je n'ai pas assez de coques alimentées pour pouvoir ensuite y installer mes racks et les rendre opérationnels. Et c'est la partie à long délai, vous devez avoir les permis de construire, les permis d'électricité, tout faire à temps. Et l'emplacement. Aux États-Unis, nous construisons beaucoup. Mais nous devons construire partout dans le monde. Et il y a des réglementations sur les données, en fait plus chaque jour. Les gens se soucient de la souveraineté de manière majeure. Et donc, pour nous, nous devons nous assurer que la flotte est une flotte mondiale, une flotte capable de gérer tous les types de charges de travail, de l'entraînement à la génération de données en passant par l'inférence. C'est une chose multivariée complexe.
Souveraineté des données et connaissance tacite
Qui devrait se soucier de la souveraineté des données ? L'Irlande possède un tas de centres de données mais n'est pas particulièrement obsédée par l'idée que les données ne devraient être qu'en Irlande. Est-ce que vous suivez simplement ce que veut le pays ou essayez-vous de conseiller s'ils devraient vouloir la souveraineté des données ou non ?
C'est un sujet qui préoccupe presque chaque pays, chaque décideur politique. Et il y a de réelles raisons légitimes. À l'ère de l'IA, je pense maintenant un peu différemment, même à propos de la souveraineté. La question ultime de la souveraineté est plutôt celle de l'avenir d'une entreprise. Si vous allez au cœur du théorème de Coase, vous dites : wow, si le modèle est celui qui sait tout, pourquoi ai-je même... je suis censé avoir des connaissances tacites qui rendent les coûts transactionnels au sein de mon organisation inférieurs à ceux du simple marché. C'est un casse-tête. L'une des façons dont je pense est que la souveraineté qui importe est la souveraineté de votre entreprise à une époque où il y a des rendements croissants d'apprentissage continu pour un modèle. La capacité de votre entreprise à avoir cette couche d'intelligence qui est un échafaudage ou même des poids intégrés dans le modèle. Ce n'est donc pas le modèle de base de quelqu'un d'autre, il s'agit de savoir si vous avez la souveraineté dans votre modèle de base. Mon nouveau concept est que l'avenir d'une entreprise est que cette entreprise a son propre modèle de base qui capture la connaissance tacite qui accélère les coûts transactionnels sur la façon dont la connaissance est accumulée et diffusée au sein de l'organisation.
Il y en a deux versions. L'idée que l'IA change la nature des entreprises. Certaines entreprises sont déjà des collections de propriété intellectuelle, Disney ou Eli Lilly, c'est une entreprise de PI de manière importante. À l'heure actuelle, cette PI se trouve dans tous les e-mails et documents et dans la tête des gens surtout, alors que peut-être la PI pourrait être dans un seul modèle au fil du temps. Les gens soulignent souvent que les entreprises actuelles sont calquées sur les entreprises manufacturières et le type d'organisation d'Alfred Sloan, malgré le fait que nous faisons du travail de la connaissance aujourd'hui et non de la gestion d'une ligne de fabrication. Obtient-on des entreprises au look plus étrange ? Obtient-on la fameuse très petite entreprise à un milliard de dollars ? Obtient-on des entreprises Internet plus décentralisées ? Obtient-on des DAO ?
Ce sont aussi des possibilités. La structure elle-même pourrait changer et il sera plus possible d'avoir l'entreprise d'une seule personne valant un milliard de dollars, cela pourrait arriver ou les DAO pourraient arriver. Mais la question intéressante pour moi est : où réside la connaissance tacite ? De toute évidence, elle réside dans la tête des gens et c'est le savoir-faire classique qui s'accumule et se combine. Je pense qu'elle résidera et se combinera également sous forme de poids dans une couche LoRA propre à votre entreprise. La nouvelle propriété intellectuelle chez Eli Lilly ou chez Microsoft ou chez Stripe pourra à un moment donné être aussi, outre tous les humains et tous les autres artefacts que nous avons, dans un certain 'embedding' (enchâssement).
Stripe est intéressant car il n'a pas vraiment d'effets de réseau puissants en tant qu'entreprise. Quand nous avons commencé à construire Stripe, c'était une expérience d'API en solo et nous facilitons l'utilisation de Stripe, mais au final, vous ne sauriez jamais que quelqu'un d'autre utilisait Stripe. Ce qui s'est passé au fur et à mesure de notre croissance, c'est que nous avons maintenant un réseau de confiance où nous pouvons prévenir la fraude grâce au fait que nous avons vu la plupart des utilisateurs d'Internet. Nous savons à quoi ressemble le bon et le mauvais et même le fait que nous ne vous ayons jamais vu auparavant est intrinsèquement un peu suspect parce que nous avons vu la plupart des gens. Cela devient un réseau de réputation comme reCAPTCHA pour Google est devenu de la même manière un réseau de réputation. Nous formons maintenant un modèle de base pour les paiements où nous utilisons toutes les données que nous avons dans le réseau Stripe et vous avez un modèle beaucoup plus large et performant prenant en compte, donc nous essayons de faire exactement ce que vous dites-
Alors, comment protégez-vous cela d'une fuite vers le modèle de base ? Est-ce juste à une étape de capacité de distance parce qu'il a appris comment faire de la détection de fraude ? Est-ce une autre dimension multidimensionnelle ou non ? Et c'est là la question clé. Il y a deux arguments. L'un est que les modèles vont dévorer le monde. On peut facilement se dire : oh oui, après tout, tout n'est qu'un motif et je vais tout apprendre. Mais Stripe peut alors prendre plusieurs modèles, construire cette incroyable couche de détection de fraude orientée modèle. Et puis il y a cette mémoire et ces outils utilisés et cet espace d'action qui est propre à Stripe. C'est l'avenir d'une entreprise, que ce soit une entreprise pharmaceutique, une entreprise de paiements ou une entreprise de logiciels. C'est le travail que nous faisons tous et que nous ferons. Et cela, pour moi, c'est la souveraineté.
Excel et la durabilité des outils de productivité
D'accord. Cela pourrait être un nouveau score record. Et quatre, 74. Nouveau record.
Et voilà.
Je réfléchis encore à cette discussion sur l'IDE pour les gens qui ne sont pas ingénieurs logiciels et j'ai l'impression qu'il pourrait y avoir un produit dans les 10 prochaines années pour les gens de la finance où, avec le recul, c'est évidemment l'interface utilisateur correcte, mais tout comme le tableur est apparu de nulle part en tant qu'interface, on pourrait avoir l'impression qu'il sort de nulle part à ce moment-là. Je suis vraiment frappé par ça. En parlant du tableur, c'est un rite de passage pour certaines entreprises de logiciels que d'essayer de s'attaquer à Excel et il semble s'en sortir plutôt bien 40 ans plus tard. Pourquoi est-il si durable ?
C'est incroyable. À un certain niveau, l'idée qu'une forme tabulaire, je pense que ce s'est la puissance des listes et des tableaux. C'est juste parfait et la malléabilité du logiciel. C'est de là que vient la durabilité, c'est pourquoi un canevas clignotant sera toujours là. Vous pouvez y ajouter beaucoup de fioritures. La même chose avec les tableurs. Mais l'autre chose à propos du tableur est qu'il est Turing-complet. On ne lui accorde pas assez de crédit. Je peux lui faire tout faire.
Je pense que c'est l'environnement de programmation le plus accessible au monde.
À 100 %. On s'y met sans même penser qu'on programme. Et c'est l'autre beauté. L'IA, nous l'avons encore mystifiée, parlé de gestion du changement. Quand les tableurs sont arrivés, personne ne parlait de gestion du changement, on les utilisait tout simplement. C'est l'autre chose : quelles sont ces choses de cette époque que nous découvrirons et qui permettront la remise en question fondamentale du travail, de l'artefact de travail et du flux de travail.
Commerce agentique et partenariat Microsoft-Stripe
C'est une période tellement intéressante pour être dans le logiciel. Je veux dire, par rapport à vous, vous devez le ressentir. C'est tout simplement une période bien plus intéressante maintenant qu'il y a cinq ou dix ans.
C'est intéressant. Ce qui s'est passé, c'est que nous étions en mode 'cloud, cloud, cloud'. Si vous m'aviez demandé quelle était la chose la plus en vogue en 2019, nous avions construit cette fantastique base de données multi-régions ou sans région qui était multi-format, Cosmos DB, qui était essentiellement une base de données JSON, nous y avions du SQL, c'était la base de données universelle. Puis la pandémie est arrivée. Ensuite, le cloud est passé à la vitesse supérieure. Teams est tout simplement devenu la référence. On en sort et on se dit : oh, je pensais qu'après la pandémie, nous allions atteindre un état stable. En fait, je me souviens d'une prévision du cloud, nous nous demandions ce que nous devions faire, nous avions surconstruit pendant la pandémie. Et il y a eu huit bons mois où nous étions... et maintenant cette chose est arrivée.
Il y a beaucoup de graphiques sur la forme de Stripe. Je ne sais pas si c'était pareil pour Microsoft, où en mars 2020 on a vu cette discontinuité, n'est-ce pas ? Beaucoup plus d'activité de commerce électronique et nous avons vu le taux de création d'entreprises en ligne parce qu'il y avait des entreprises qui étaient uniquement hors ligne et qui se disaient 'nous devons passer à la vente en ligne'. Et c'est resté à ce niveau élevé pour toujours. Évidemment, depuis lors, cela a augmenté à partir de là, mais il n'y a pas eu de baisse correspondante lorsque les gens sont retournés dans les bureaux physiques. C'était juste un changement d'étape et c'est resté à ce niveau élevé pour toujours. Je suis sûr que vous avez vu des choses similaires dans Azure et des choses comme ça.
Oui, à 100 %. Ce n'est jamais redescendu.
Nous parlons de commerce, alors autant parler de ce sur quoi nous travaillons ensemble.
C'est vrai, nous en sommes très enthousiastes. L'idée qui a toujours été là est : quel est le meilleur ensemble de rails pour les marchands et quel est l'ensemble de rails pour les clients ? Y a-t-il une correspondance parfaite ? Le commerce conversationnel est une chose dont on parle. Et maintenant, avec le travail que vous avez fait et que d'autres ont fait, nous pouvons vraiment rapprocher le marchand et l'utilisateur final et avoir ce genre d'expérience agentique. Ce n'en sont qu'aux débuts, cela doit être fait avec goût, cela doit être fait d'une manière qui gagne la confiance de l'utilisateur. Je suis donc très enthousiaste à ce sujet.
Nous voyons deux différences ici parce qu'il y a eu des tentatives précédentes d'achat sur Twitter ou sur Instagram et ce genre de choses. Mais ce qui est différent ici, c'est d'une part l'IA, de sorte que toutes les intégrations pour le marchand sont beaucoup plus faciles. C'est un effort bien moindre que les fois précédentes où des choses comme celle-ci ont été essayées. Mais d'autre part, je pense que l'expérience est tellement convaincante pour un utilisateur final. Nous le voyons déjà dans les premières données des tout premiers clients que nous avons. Nous avons lancé il y a quelques semaines dans ChatGPT également. Cela doit fonctionner. Et les données le confirment déjà car c'est tellement plus facile pour un client final.
J'en ai parlé, je suis un peu mordu de cricket, donc je cherche toujours quelque chose. Et que ce soit sur Amazon ou Walmart, l'expérience de recherche est parfois difficile sur le site. Ces expériences de chat sont d'abord fantastiques, et le fait qu'elles renvoient au catalogue. Le catalogue est toujours roi. Et maintenant si je peux marier le paiement et le catalogue. C'est là que je pense que la fluidité se trouve.
Eh bien, avez-vous des expériences où, pour la recherche de produits, utiliser une application d'IA est bien mieux qu'une recherche par mots-clés ? C'est incroyable que jusqu'à l'année dernière, nous pensions que la recherche par mots-clés était un moyen acceptable de chercher quoi que ce soit.
Oui, en fait, cela crée un catalogue personnalisé pour vous. La réponse ne ressemble pas à une page de résultats de recherche (SERP).
Nous achetions des meubles pour notre maison et nous nous disions juste : oh nous avons tel espace disponible à cet endroit, quelle pièce pensez-vous irait bien là tout en respectant ces dimensions ? C'est fou qu'on ne faisait pas ça auparavant. Toute cette personnalisation, pouvoir donner des 'vibes', une esthétique générale, je cherche quelque chose d'un peu plus haut de gamme mais pas trop sophistiqué. Au fait, c'est l'autre truc fou. Ma femme est architecte, et elle a ce carnet Copilot dans lequel elle a toutes ces photos d'architecture. Vous pouvez lui poser des questions de raisonnement de haut niveau sur ce que je devrais mettre là. Il est capable de prendre un croquis ou un dessin d'architecture, puis de prendre un catalogue public de meubles et d'assembler ces choses et de raisonner à leur sujet. Ce genre de chose est assez magique.
Notre point de vue là-dessus, c'est que nous sommes vraiment à fond sur l'IA ('AI-pilled') en ce qui concerne le commerce chez Stripe et nous pensons qu'une part énorme va se déplacer ici et toutes les conversations avec les marchands que nous avons le confirment. Ma façon de voir les choses est que si vous faites de la découverte ouverte, 'oh je suis intéressé par une tenue pour telle occasion', je ne sais pas exactement ce que je veux, l'IA sera bien meilleure pour vous aider avec ça que les expériences actuelles où vous cliquez sur une liste de résultats de recherche. Et puis si vous faites une recherche ciblée où je cherche un objet spécifique qui répond à ces besoins, 'je veux ce composant pour mon vélo', alors pouvoir aussi spécifier avec l'IA les paramètres exacts de la recherche sera bien mieux. On se dit : attendez, si vous prenez toute la découverte non dirigée et si vous prenez aussi toute la recherche hautement dirigée, n'est-ce pas tout simplement tout le commerce qui se passe sur Internet ? La seule chose qui reste, ce sont les produits de base récurrents, j'ai besoin de commander plus de nourriture pour animaux. Cela me semble le moins affecté, bien qu'il faille bien sûr découvrir la marque de nourriture pour animaux à l'origine. Mais Etsy a été un premier partenaire formidable parce que tous les produits sont personnalisés.
Cela me semble tout à fait logique. La partie découverte, que des gens comme Instagram et d'autres ont très bien faite. La question est donc : quelle est la couche de découverte ? Nous avons une couche de découverte personnalisée, de l'inspiration pour les produits, ce que Pinterest a fait est intéressant. Donc une couche comme celle-là mariée à cette interface conversationnelle.
Eh bien, ce sera une marée montante qui profitera à tout le monde. Une partie de ce que nous faisons ici est de rendre les catalogues de produits des marchands découvrables à distance, ainsi que l'inventaire et tout le reste, puis achetables à distance, sans forcément avoir à passer par tout le flux de leur côté. Vous pouvez simplement le faire à l'intérieur de l'expérience 'baguette magique' de Copilot. C'est, au niveau technique pur, ce que nous faisons et ce que nous connectons. Je pense que ce qui est excitant, c'est que Pinterest a joué avec le commerce il y a quelques années, peut-être 10 ans. Ça n'a pas décollé comme quelque chose d'énorme, mais maintenant si vous avez tous les marchands qui proposent leurs catalogues de produits dans le cadre de ce protocole, alors les sites sociaux comme Pinterest, Instagram et Twitter ont une nouvelle chance dans ce genre d'expérience commerciale car vous avez beaucoup plus de soutien et d'adoption de la part des marchands que la première fois.
Nous avons un projet appelé le NL Web et l'idée est vraiment de prendre chaque catalogue de chaque marchand et de lui donner une interface NL Web avec laquelle un agent peut ensuite discuter pour pouvoir interroger et obtenir une recherche approfondie. Parce qu'aujourd'hui l'un des plus grands défis est la qualité du catalogue et la capacité à utiliser le raisonnement pour faire une recherche approfondie. Et si vous pouvez résoudre cela, alors chaque produit trouvera sa requête.
Nous développons donc cette plateforme dans le commerce agentique où nous avons des protocoles open source comme notre protocole de commerce agentique. Nous avons évidemment les produits Stripe habituels pour lesquels les gens nous utilisent et c'est particulièrement délicat du point de vue des paiements car vous cherchez à ce qu'une application d'IA effectue des paiements au nom d'autres personnes sur tous ces différents sites du web sans partager tous vos détails de paiement. Il y a des choses intéressantes au niveau des paiements que nous faisons. Nous cherchons à construire une plateforme dans le commerce agentique. Quel conseil auriez-vous pour nous alors que nous construisons dans cet espace très naissant mais qui a manifestement une adéquation produit-marché ?
Que signifie participer à ce flux de travail agentique pour chaque marchand ? Chaque marchand devra maintenant en quelque sorte venir voir quelqu'un comme Stripe et dire : hé, j'ai un catalogue, j'ai un checkout, s'il vous plaît aidez-moi à rencontrer les agents de la manière la plus fluide possible. C'est ce pour quoi j'embaucherais Stripe si c'est fait avec goût. Et je pense que l'intégration des marchands, parce que je suppose que la longue traîne des marchands pouvoir cliquer et dire : hé, activez-moi pour le commerce agentique, sera la chose qui va stimuler parce que la bonne nouvelle ici est qu'il y en aura plusieurs. ChatGPT est le gros, mais il y aura Google, nous serons là, Meta sera là, il y aura Perplexity, il y aura beaucoup de concurrence, il y aura beaucoup de portes d'entrée en tant qu'agrégateurs. Mais la chose la plus intéressante est qu'ils voudront eux-mêmes sur leur site web ou sur leur application mobile prendre en charge les requêtes en langage naturel. Tout cela étant activé pour que mes propres agents aillent interroger ces choses. C'est donc le point clé à résoudre correctement. Parce qu'aller voir un petit marchand et lui dire : hé, va monter un serveur MCP, fais ce protocole, ce protocole... quel est le bouton 'facile' ?
Je pense que l'autre chose que nous allons voir est une fusion d'une partie des expériences agentiques. Nous parlons de commerce agentique ici. Nous avons reçu Des Traynor d'Intercom, ils font maintenant du service client assisté par IA et remplacent les humains qui font du service client par l'IA. Ce qu'ils voient est une énorme quantité de demande induite où les gens viennent initialement pour des requêtes de type centre d'assistance et puis c'est 'wow, c'est une bien meilleure façon de naviguer sur le site web' et c'est presque comme une ligne de commande. Vous ne pouvez pas encore passer autant à l'action qu'il sera possible de le faire. Mais je me demande aussi à quel point toutes ces expériences fusionnent où nous faisons les trucs d'achat ici qui croissent et s'étendent, et peut-être qu'il y a de la découverte. Ils font les trucs de service client là-bas.
C'est universel.
Quand est-ce que cela devient une application en ligne de commande ? Je trouve l'espace de la mode intéressant : la technologie est incroyablement pauvre avec beaucoup de sites web où les gens essaient de faire ce truc très esthétique, basé sur l'ambiance, 'je cherche quelque chose comme ça mais un peu plus chic'. Tout est basé sur la recherche par mots-clés et le marquage manuel. Des choses comme ça me semblent parfaitement adaptées à une expérience interactive basée sur l'IA où, comme vos invites Midjourney, vous vous dites : non, l'image n'était pas tout à fait correcte, changez-la de cette façon. Faire cela avec le commerce serait vraiment intéressant.
C'est logique. Intuitivement, le service client est aussi de la vente interne. Intuitivement, cela a du sens et, assurément, dans le monde agentique, vous pouvez assembler ces choses de sorte que les coutures ne soient plus ce qu'elles sont aujourd'hui.
Peut-être que ce que nous décrivons est un ensemble de couloirs établis par des accidents aléatoires de logiciels et d'organigrammes. Vous faites du service client quand les gens viennent avec une requête de nature non commerciale. Vous êtes un SDR, vous faites peu importe. Toutes ces distinctions vont probablement s'estomper.
Disparaître, oui.
Fidélité aux modèles et stratégie de plateforme
Nous parlons beaucoup des applications d'IA que les gens utilisent, de Copilot, ChatGPT, Gemini et tout ce genre de choses. Il y a un débat sur l'importance de la qualité du modèle. Est-ce que les gens choisissent une marque et ils boivent du Coca depuis toujours et même si Coca changeait la formule, les gens auraient toujours une marque préférée ? J'utilise O3, ma femme utilise GPT-5, je suis toujours horrifié parce que je me dis 'tu mérites plus d'intelligence que ça' et tu ne m'enlèveras pas O3 même de mes mains froides et mortes. Où vous situez-vous dans le débat de savoir si les gens sont fidèles à un modèle ou s'ils sont fidèles à une marque d'IA et comment cela affecte-t-il votre stratégie commerciale ?
Dans les produits de consommation, c'était la première fois que nous voyions que lorsque vous changiez de modèles, ce n'étaient pas des changements uniformes et qu'ils impactaient les gens différemment. La personnalité en est une, ou le style. C'est tout simplement une nouvelle dimension. C'est aussi un argument selon lequel il s'agit d'une nouvelle dimension de différenciation peut-être. Il y a le côté QI, le côté QE, et puis tous ces points de style et c'est peut-être vers cela que les gens orienteront les choses. À long terme pour moi, je pense qu'il faut s'assurer que les modèles sont les plus capables pour la tâche difficile à haute valeur ajoutée. Ensuite, vous optimisez continuellement après avoir eu accès à cela pour la tâche en cours. En tant que créateur de produits pour nous, mon truc est de sortir le modèle qui est le plus capable, mais ensuite ce qui est en production, ce sont plusieurs modèles. Ma chose préférée dans GitHub, par exemple, c'est Auto, qui consiste à vouloir garder... les gens aiment toujours manifestement Sonnet. Au bout du compte, je veux vraiment le sélecteur de modèle et il ne peut pas s'agir d'un simple routeur de modèles stupide. Il doit fondamentalement avoir l'intelligence de savoir que cette tâche mérite ce genre de coût ou ce type d'intelligence et c'est la complexité de mon dépôt ou de ma tâche de PR. C'est ultimement là que se trouvera l'avenir des agents, et par conséquent, vous voulez un ensemble de modèles dont vous avez des agents qui servent d'intermédiaires afin qu'il réponde à vos besoins. Et ensuite vous aurez des préférences.
La préférence de chacun ne sera-t-elle pas simplement pour plus d'intelligence ? J'irai dans le sélecteur et choisirai manuellement O3 pour une requête type 'où devrais-je aller chercher une glace'.
C'est l'habitude, vous ne croyez pas ? Mais c'est une décision réfléchie importante. Mais c'est vrai. Je veux dire, c'est très dur pour n'importe lequel d'entre nous... c'est pour cela que les réglages par défaut comptent et nous aimons nos réglages par défaut. Nous n'aimons pas que l'on déplace notre fromage. Même pour la sélection de modèles, si vous retiriez maintenant la sélection de modèles, ce serait un problème et il faut donc être prudent. Mais je pense qu'à long terme, si je peux faire confiance à quelque chose pour toujours faire quelque chose pour moi là où il fait une sélection qui, d'une manière ou d'une autre, est délicieuse, alors c'est là que je déléguerai.
Donc vous pensez que c'est là que vous devez en arriver : que je vous fasse confiance pour choisir un modèle approprié pour la requête.
Exactement.
La pile technologique de Microsoft : Jetons et Agents
Mon modèle mental de Microsoft est que vous jouez simplement sur chaque partie de la pile en ce sens que vous avez Copilot, vous avez votre participation dans OpenAI, vous avez la couche Azure, vous avez les puces, tout. Est-ce que certains sont plus importants pour vous que d'autres ? Quelle est la victoire impérative ? Allez-vous faire des verticaux ?
À la base, la façon dont je le conceptualise est que notre activité d'infrastructure doit être fantastique pour construire ce que j'appellerai l'usine à jetons (tokens). Il s'agit du nombre de jetons par dollar par watt, d'être vraiment super efficace là-dedans. Ensuite, je dirais que nous avons une autre couche qui est l'usine à agents. Et la différence entre l'usine à jetons et l'usine à agents est d'utiliser les jetons le plus efficacement possible pour stimuler un résultat commercial ou un résultat de préférence des consommateurs, ce qui est la valeur par jeton telle qu'évaluée par le domaine spécifique qui intéresse les gens. Et cela a des outils autour, c'est le nouveau niveau d'application ou le serveur d'application. Chaque nouvelle plateforme a toujours eu... il y avait le web et il y avait un serveur web, ceci est le cloud de l'IA. Ensuite, nous voudrons certainement construire nos propres systèmes d'intelligence ou systèmes d'IA. C'est la famille de Copilot, que ce soit pour le travail d'information, pour le codage ou le développement de logiciels, c'est le GitHub Copilot, la sécurité est un autre domaine où nous allons absolument être un acteur majeur. Ce seraient les trois horizontaux. Nous aurons également des applications commerciales. L'autre domaine dans lequel nous faisons beaucoup est la santé et la science. Dans la santé, nous avions acheté Nuance et maintenant nous avons quelque chose qui s'appelle DAX Copilot. C'est la diarisation de prise de notes pour les médecins, la capacité pour un médecin de passer plus de temps avec ses patients et ensuite l'IA fait tout le reste en termes de tout, du codage à la prise de notes. Nous avons un excellent partenariat avec Epic. C'est une partie intégrée d'Epic. C'est ce que nous faisons dans la santé. Et puis nous faisons aussi des trucs dans Copilot pour la santé grand public. L'autre domaine est la science. Et la science s'avère être un grand domaine pour l'orchestration de la boucle externe, c'est-à-dire que la méthode scientifique nécessite de créer l'hypothèse, puis d'exécuter plusieurs expériences in silico, de revenir, d'affiner, et ainsi de suite. Pour moi, c'est une autre chaîne d'outils. C'est un peu comme si nous essayions de découvrir une combinaison du GitHub Copilot rencontrant le travail de connaissance de Microsoft 365 Copilot pour le scientifique où ils ont les sources d'information faisant autorité, ils ont les interfaces, les outils utilisés pourraient même être le serveur MCP pour le laboratoire humide. Puis-je m'interfacer avec lui ? Et ensuite, comment orchestrez-vous tout cela de sorte que la boucle scientifique puisse aller plus vite ?
Stratégie de plateforme : Regroupement vs Modularité
En tant que entreprise de plateforme, vous avez toujours des décisions à prendre sur le moment où vous devriez essayer de regrouper des produits, le moment où vous devriez essayer de les lier et d'imposer qu'ils soient utilisés ensemble, et le moment où vous ne devriez pas. L'exemple classique est Apple qui ne vous laissait initialement utiliser un iPod qu'avec un Mac et essayait de l'utiliser pour stimuler les ventes de Mac, puis a abandonné et a sorti iTunes pour Windows. Ce que j'ai compris, c'est que c'était une décision totalement aléatoire. Évidemment, toute l'histoire de Microsoft est pleine de ces exemples intéressants. Je ne pense pas que les gens réalisent à quel point Microsoft était ouvert à ses débuts : en 1985, la majeure partie des revenus de Microsoft provenait des applications Macintosh et ensuite, pour les systèmes d'exploitation Microsoft, la plupart des applications étaient tierces. C'était une stratégie totalement ouverte. Et puis vous avez eu l'ère Windows du couplage serré entre Office et Windows, ces deux-là se renforçant mutuellement. Ensuite, très tôt, j'ai eu l'impression qu'Azure et le cloud étaient un endroit où l'on pouvait exécuter son SQL Server, puis on a adopté pleinement Linux plus tard. Je suis curieux parce que nous y réfléchissons en tant qu'entreprise de plateforme et nous avons adopté ces derniers temps beaucoup plus de modularité où Stripe Radar peut être utilisé même si on n'utilise pas Stripe pour les paiements. Comment pensez-vous de manière générale à votre cadre de travail pour savoir quand les produits devraient être couplés par rapport au moment où vous les vendez indépendamment ?
Excellent point. La façon dont j'ai raisonné à ce sujet est que je pense que nous surestimons souvent le nombre de ces batailles qui sont à somme nulle. L'une des analyses dans lesquelles on doit être pointu est de savoir ce qui va être, par définition, multijoueur. Le cloud en est un exemple classique. Je me souviens même à l'époque quand j'ai commencé, et Azure a commencé bien plus tard qu'AWS, les gens me disaient : AWS n'a-t-il pas tellement d'avance, où y a-t-il de la place pour un deuxième cloud ? Ayant été en concurrence contre Oracle et IBM sur tous les serveurs de niveau intermédiaire, je sentais que les clients commerciaux allaient, dans l'ensemble, exiger un choix multiple. C'est cette compréhension structurelle qui nous a poussés à persévérer. Un peu comme si vous emballez trop les choses, vous pourriez réduire votre marché adressable (TAM) et ne pas être compétitif. Par exemple si nous avons construit Azure, nous l'appelions Windows Azure. C'est un problème parce qu'Azure n'a aucun sens juste pour Windows. Il doit supporter Linux comme étant de premier ordre, il doit supporter MySQL et Postgres comme étant de premier ordre. C'est ce qui nous a permis de nous assurer que vous devez faire un excellent travail avec SQL Server, mais vous devez faire un travail aussi remarquable qu'Amazon le ferait avec Postgres ou MySQL. Et donc cela a été poussé principalement par le fait que c'est le marché, c'est ce que les clients attendent de nous, et nous allons avoir une concurrence rude. C'est ainsi que je définis ma modularité : quelle est la chose qui maximise les opportunités de marché de ma pile ? Ensuite oui, nous sommes une entreprise et il devrait y avoir une théorie sur certains avantages d'intégration et effets de plateforme. Qu'est-ce que c'est et comment faisons-nous un excellent travail là-dessus ? Chaque couche de la pile, même dans Azure, quelqu'un devrait pouvoir venir et dire : je veux juste utiliser Azure pour ses services matériels nus (bare metal). J'ai juste besoin de clusters Kubernetes partout, mais j'ai juste besoin que vous fassiez la partie gestion et j'apporterai tous mes logiciels. Pas de problème, nous devons gagner cette charge de travail. Peut-être qu'après cela, nous aurons au moins une chance un jour, quand il deviendra vraiment pénible de gérer votre base de données multi-régions par vous-même, que vous direz : oh laissez-moi simplement utiliser Cosmos. Mais c'est une décision séparée.
Mais n'y a-t-il pas toujours un débat entre 'si nous avons Linux sur Azure, nous vendrons plus d'Azure', mais ensuite les gens de Windows disent 'oui mais vous handicapez Windows Server'. Il y a des endroits où Microsoft est ouvert. Il y a d'autres endroits, Microsoft Flight Simulator n'est pas disponible sur la PlayStation, il est disponible sur la Xbox. Je ne sais pas, c'est peut-être un peu exagéré, mais le chat Teams et la vidéo Teams ne sont pas vendus séparément, ils font juste partie d'une seule chose et cela a du sens et rend le pack plus convaincant. Ne finissez-vous pas toujours par avoir ces débats sur le fait de savoir si le coût du regroupement l'emporte sur les avantages du regroupement ?
Je pense que certains de ceux-là, comme par exemple le truc Teams, sont un classique. Teams est né comme un produit qui réunissait ces quatre choses. Comme Outlook, Outlook a été apporté, il y avait un gestionnaire d'informations personnelles (PIM) avant, il y avait un client de messagerie avant et le calendrier était séparé. Et Outlook a été le premier échafaudage qui disait : nous apportons ces trois choses pour accomplir un travail. Même chose avec Teams, nous avons apporté le chat et les canaux et la vidéo et tout le reste dans un seul ensemble. Donc le regroupement était le produit. Ensuite, bien sûr, vous pouvez dire que cela doit avoir une place de marché ouverte et que cela doit s'intégrer à d'autres choses. La modularité doit être pensée de manière à avoir du sens au niveau atomique. Ensuite, vous ne voulez pas trop réfléchir aux synergies ou aux effets d'intégration au point de ne plus être compétitif. Une chose classique serait si nous construisions un cloud public incroyable sauf qu'il ne ferait tourner que des charges de travail Windows ou SQL, ce serait essentiellement une très petite tranche du marché. C'était donc dans notre intérêt et certainement dans l'intérêt de répondre aux besoins des clients. Pouvoir vraiment, comme dans la pile de l'IA, c'est ainsi que je le vois. Nous avons une activité d'infrastructure, nous avons une activité de serveur d'application, et nous avons une activité d'applications. Je veux que ces trois choses tiennent sur leurs propres mérites. Nous voulons bien sûr nous-mêmes avoir la boucle de rétroaction à travers ces trois couches, mais les clients et les partenaires choisiront par quelle porte ils entrent.
L'impression que j'ai est que lorsque vous avez pris la direction de Microsoft, vous avez fait basculer la culture d'une vie Microsoft hautement regroupée vers une stratégie plus ouverte et interopérable.
Mon truc était peut-être de revenir au Microsoft des années 80. La majeure partie de ce qui s'était passé, c'est que dans les années 90 il y avait Microsoft et il n'y avait à peu près rien d'autre. Il y avait beaucoup plus de nos trucs qui se rejoignaient sur le client ou sur le serveur. Les années 80, c'était genre Office sur le Mac. Windows est venu plus tard. Le concept que Bill avait quand il a commencé Microsoft était que c'est une usine à logiciels. Je ne suis amoureux d'aucune catégorie en particulier. Je vais juste construire la meilleure usine à logiciels et elle va sortir n'importe quel produit. Flight Sim. Vous voulez un interpréteur Basic ? Pas de problème. Vous voulez un système d'exploitation ? Nous en avons un aussi. C'était l'idée. Et à un moment donné, nous sommes entrés dans un verrouillage entre quatre ou cinq parties de cela qui sont devenues Windows et Windows NT et le client-serveur. J'ai réalisé quand je suis devenu PDG que le marché allait être beaucoup plus grand et beaucoup différent et nous n'avions pas la plateforme mobile à cette époque. Nous devions vraiment nous assurer de rester pertinents dans les plus grands marchés que nous pouvions adresser en réunissant nos produits dans des configurations qui avaient du sens. C'était en fait beaucoup moins de dogme. C'était dans l'ADN profond de l'entreprise que nous pouvons porter nos logiciels sur chaque plateforme.
Culture d'entreprise et leadership à grande échelle
En parlant de l'ADN profond de l'entreprise, il y a la célèbre caricature de Microsoft avec tous les pistolets pointés les uns vers les autres. Combien de peaufinage culturel avez-vous dû faire ? Comment fait-on cela concrètement quand on en vient aux choses sérieuses ? On peut dire toutes les belles choses lors des réunions générales, mais au final la culture se résume à ce que l'on tolère ou non et à la façon dont les décisions sont prises.
J'ai appris deux choses de tout cet épisode parce que je suis un pur produit interne. Tout ce qu'il y a eu de bon et de mauvais chez Microsoft au cours des 35 dernières années, je l'ai vécu. J'ai senti que nous perdions notre propre conviction parce que nous perdions le récit. Cette caricature est un excellent exemple de quelqu'un d'autre définissant ce qui est devenu le récit culturel plus que la réalité. Les gens ont commencé à s'identifier à la caricature. L'un des problèmes fondamentaux des réseaux sociaux d'aujourd'hui et de l'air du temps est que l'on peut absolument perdre le récit. C'est complètement réflexif. Cela ne signifie pas que nous étions tous des divisions parfaites et en grande harmonie. Certaines de ces tensions divisionnaires sont de vrais problèmes qui nécessitent de la tension. La cohésion sociale n'est pas un but. Gagner sur le marché est un but. Mais à un certain niveau, il faut orchestrer ces grandes organisations. On peut même avoir deux équipes en compétition par conception. Les leaders et la façon de communiquer dans le monde d'aujourd'hui où vos employés lisent des choses sur vous à l'extérieur et se forgent des opinions sur vous est l'un des défis de leadership les plus difficiles. Comment gagne-t-on la confiance, comment s'assure-t-on vraiment qu'ils peuvent ressentir la réalité, façonner la réalité ? L'autre chose est que tout le monde pense que c'est le système, c'est ce gars-là au sommet qui a tout le pouvoir et moi aucun. La réalité est que le pouvoir est beaucoup plus diffus et distribué. Comment aide-t-on vraiment les gens à s'en emparer et à remodeler ? Une autre des choses célèbres que les gens disent est : je ne quitte jamais des entreprises, je quitte des managers. Je crois à cela et ce sont donc des micro-cultures. Elles peuvent être façonnées. Quand je regarde ma carrière chez Microsoft, j'ai eu la chance de tomber sur ces gens qui ont créé ces environnements incroyables dans l'entreprise. C'est pourquoi je suis resté et comment j'ai prospéré. On sent que plus on a besoin de culture au sommet, un récit qu'il faut vivre et être cohérent. C'est là que cet état d'esprit de croissance ou 'apprendre tout' par opposition à 'tout savoir' a été super utile pour nous comme simple cadre parce que personne ne le voit comme mon dogme. C'est un truc de psychologie de l'enfant bien compris qui plaît aux gens en dehors du travail. Le défi pour nous tous dans le monde d'aujourd'hui est de ne pas laisser les mèmes des réseaux sociaux nous définir. Quelle est cette force intérieure qui existe dans une organisation et qui peut résister au mème social ? C'est la clé.
Combien de personnes travaillent chez Microsoft ?
Je pense environ 200 000.
Microsoft, c'est 200 000 personnes, Stripe, c'est 10 000 personnes. Peut-être qu'il y a quelqu'un qui dirige une entreprise de 500 personnes. Beaucoup de choses que nous faisons sont probablement assez indépendantes de l'échelle, où l'on essaie de s'assurer de parler aux clients, on organise un séminaire de direction, on regarde les chiffres pour 26. Il y a beaucoup d'activités dans les entreprises qui sont un peu les mêmes quelle que soit la taille. Cela dit, il y a aussi probablement des choses qui n'apparaissent qu'à l'échelle d'une cité-état de 200 000 personnes. Quels effets n'apparaissent que quand on est aussi grand ?
Il y a deux choses que je dirais. Prendre la relève d'un fondateur. Steve et Bill ont construit l'entreprise. Paul et Bill ont commencé et Steve et Bill l'ont mise à l'échelle. J'étais la première personne non-fondatrice. J'ai vite réalisé que j'avais besoin d'une équipe, juste pour avoir la capacité de gérer l'envergure. Mais ensuite être clair sur ce que le PDG doit clairement faire : dans quels secteurs d'activité êtes-vous présent, dans quels secteurs n'êtes-vous pas, synthétiser l'extérieur, avoir les normes, fixer les normes pour la culture, et ensuite la capacité d'avoir cette culture de la performance où l'on ne peut pas dire 'je ne m'occupe que du long terme' ou 'je ne m'occupe que du court terme', il faut livrer les deux. Saisir réellement les quatre ou five choses que vous seul pouvez faire et ensuite construire l'équipe. On dirait que même à 500 personnes c'est ce qu'on fait, mais franchement on peut le garder dans sa mémoire de travail. En grandissant comme développeur, il y avait un ensemble de choses, tout le monde parlait de combien de lignes de code on connaissait personnellement. À un certain point on dit : c'est la personne qui connaît ce module ou cette bibliothèque. Au début tout le monde commence par connaître chaque ligne de code. À un certain niveau, il faut en arriver à la personne qui connaît la personne qui a écrit ça. Et je pense que cette modularité et la construction d'équipe et la cohésion sont la chose la plus importante.
Peut-être qu'à l'échelle de Stripe ou à une échelle plus petite, on peut encore raisonner sur le produit en tant que produit et connaître tout ce que l'on expédie.
Mais je pense aussi que les fondateurs sont uniques en ce sens. Les fondateurs ont grandi avec l'entreprise depuis le premier jour. Il est difficile de prendre la mémoire de travail d'un fondateur et de dire : laissez-moi la prendre et l'imprimer sur un PDG professionnel. Ça ne marche tout simplement pas. Même pour moi, j'ai rejoint l'entreprise en 92. Je n'étais pas là au début des années 80, c'était une mise à l'échelle continue que seul le PDG fondateur voit. C'est pourquoi je pense qu'il faut avoir du respect pour ce que les fondateurs peuvent faire de manière unique et que les fondateurs aient du respect pour celui qui vient ensuite, en comprenant qu'il ne peut pas faire exactement la même chose qu'eux. Ce truc de 'mode fondateur' est intéressant, il y a clairement le culte de la personnalité d'un fondateur qui est incroyable et on l'utilise, on le maximise. Ensuite, les simples mortels PDG comme nous doivent aussi être en mode 're-fondateur' mais sans penser qu'on est un fondateur. Cette nuance est importante.
Origines à Hyderabad et passions personnelles
Dernière question. Qu'est-ce qu'il y a dans l'eau à Hyderabad pour que l'école où vous êtes allé soit aussi celle où Shantanu est allé, Ajay Banga y est allé, un tas de bons joueurs d'échecs en viennent également. Avez-vous une théorie sur cette surperformance locale ?
Le lycée où nous sommes allés, jusqu'à ce que je dise NVIDIA et Jensen, parce que Jensen nous couvre tous maintenant entre moi, Ajay et Shantanu. Le PDG de Procter & Gamble aujourd'hui vient aussi de mon lycée. C'est un peu une cabale. En grandissant à Hyderabad et en allant dans cette école à la fin des années 70 et au début des années 80, cela nous a donné beaucoup plus d'espace. Si vous regardez chacun d'entre nous, les études étaient importantes mais franchement nous excellions tous dans beaucoup d'autres choses au-delà des études. C'était une chose assez rare à l'époque dans ce pays. Je l'attribue beaucoup à mon lycée car c'est un endroit qui nous a donné beaucoup plus d'espace et de marge pour suivre ce qui est vraiment devenu notre passion, on a pu prendre son temps pour la découvrir au lieu de sentir qu'on devait rejoindre une sorte de course.
Ce n'était pas juste tracé. Quelle était votre passion au lycée ?
Le cricket.
Samuel Beckett.
Je veux connaître cette histoire.
Si vous demandiez quel est le seul sportif qui a joué professionnellement, il a joué un ou deux matchs pour l'Université de Dublin et il a joué du cricket de première classe. C'est la seule personne qui a joué au cricket professionnel et a remporté un prix Nobel.
Vraiment ? C'est vraiment drôle.
On peut donc tout avoir. C'est le chess-boxing de son époque, fusionnant le sport et l'intellectuel.
Un joueur de cricket professionnel lauréat d'un prix Nobel.
C'est génial. Vous en êtes passé près, mais dans une autre vie, cela aurait pu être vous.
Merci Satya. Quel plaisir.