Sundar Pichai

Sundar Pichai: Google Search, AI, Waymo, and the Future of Humanity

5 juin 2025

Technology
Illustration de Sundar Pichai

Introduction and Early Life in India

Lex Fridman

Ce qui suit est une conversation avec Sundar Pichai, le PDG de Google et Alphabet, sur le podcast de Lex Fridman.

Lex Fridman

Votre histoire est une source d'inspiration pour beaucoup de gens. Elle m'inspire aussi. Vous avez grandi en Inde, toute votre famille vivait dans un humble appartement de deux pièces, avec très peu, voire aucun accès à la technologie. Et à partir de ces humbles débuts, vous vous êtes élevé pour diriger une entreprise technologique de deux billions de dollars. Si vous pouviez remonter le temps et dire à ce jeune Sundar de 12 ans que vous dirigez aujourd'hui l'une des plus grandes entreprises de l'histoire de l'humanité, que pensez-vous que ce jeune enfant dirait ?

Sundar Pichai

J'en aurais probablement ri. C'était probablement trop farfelu pour être imaginé ou cru à l'époque.

Lex Fridman

Il faudrait d'abord expliquer Internet.

Sundar Pichai

C'est sûr. Les ordinateurs pour moi à l'époque, j'avais 12 ans en 1984. À ce moment-là, j'avais commencé à lire sur le sujet, mais je n'en avais pas encore vu.

Lex Fridman

À quoi ressemblait cet endroit ? Parlez-moi de votre enfance.

Sundar Pichai

J'ai grandi à Chennai. C'est dans le sud de l'Inde. C'est une ville magnifique et animée, avec beaucoup de monde, beaucoup d'énergie. Une vie simple, avec certainement des souvenirs affectueux de jeux de cricket devant la maison. Nous jouions simplement dans les rues. Tous les enfants du quartier sortaient et nous jouions pieds nus jusqu'à ce qu'il fasse sombre et que nous ne puissions plus jouer. Quand le trafic arrivait, nous arrêtions simplement le jeu, tout passait et nous continuions de jouer, juste pour que vous ayez l'image en tête. Avant les ordinateurs, il y avait beaucoup de temps libre. Maintenant, il faut aller chercher cette solitude tranquille. Les journaux et les livres sont la manière dont j'accédais aux informations du monde à cette époque. Mon grand-père a eu une grande influence. Il travaillait à la poste. Il était si doué pour les langues. Son écriture est encore aujourd'hui la plus belle écriture que j'aie jamais vue. Il écrivait si clairement, il était si éloquent. Il m'a fait découvrir les livres. Il aimait la politique, on pouvait parler de tout. C'était présent dans ma famille tout au long. Donc beaucoup de livres — des livres de gare, de bons livres, tout, d'Ayn Rand à des livres de philosophie en passant par des romans policiers stupides. Les livres occupaient une grande place dans ma vie, mais il n'est pas surprenant que j'aie fini chez Google parce que la mission de Google a toujours résonné profondément en moi, cet accès à la connaissance. J'en avais soif. Mais j'ai définitivement de bons souvenirs de mon enfance. L'accès au savoir était là, c'était la richesse que nous avions. Pour chaque aspect de la technologie, j'ai dû attendre un certain temps. J'ai déjà parlé du temps qu'il nous a fallu pour avoir un téléphone, environ cinq ans, mais ce n'est pas la seule chose.

Lex Fridman

Un téléphone.

Sundar Pichai

Il y avait une liste d'attente de cinq ans et nous avons eu un téléphone à cadran, mais cela a radicalement changé nos vies. Les gens venaient chez nous pour appeler leurs proches. Je devais aller jusqu'à l'hôpital pour obtenir les résultats des analyses de sang et cela prenait deux heures pour y aller et on me disait : « Désolé, ce n'est pas prêt. Revenez demain. » Deux heures pour revenir et c'est devenu une affaire de cinq minutes. Alors, enfant, j'ai eu un déclic, ce pouvoir de la technologie pour changer la vie des gens. Nous n'avions pas d'eau courante, c'était une sécheresse massive. Alors ils apportaient de l'eau dans ces camions, peut-être huit seaux par foyer. Donc mon frère et moi, parfois ma mère, nous faisions la queue, nous récupérions l'eau et la rapportions à la maison. Plusieurs années plus tard, nous avons eu l'eau courante et un chauffe-eau, et on pouvait avoir de l'eau chaude pour prendre une douche. Pour moi, tout était distinct comme ça. J'ai donc toujours eu ce sentiment direct de la façon dont la technologie peut radicalement changer votre vie et des opportunités qu'elle apporte. C'était une sorte de conclusion subliminale pour moi tout au long de ma jeunesse, je l'ai observé et ressenti. Nous avons dû convaincre mon père pendant longtemps pour avoir un magnétoscope. Vous savez ce qu'est un magnétoscope ?

Lex Fridman

Ouais, j'essaie de vous donner un âge là.

Sundar Pichai

Avant cela, il n'y avait qu'une seule chaîne de télévision. C'est tout. Et donc on pouvait regarder des films ou quelque chose comme ça. Mais quand j'étais en terminale, nous avons eu un magnétoscope. C'était un Panasonic que nous avions dû aller acheter dans une boutique qui l'avait fait passer en contrebande, je suppose, et c'est là que nous avons acheté un magnétoscope. Mais ensuite, être capable d'enregistrer un match de football de la Coupe du Monde ou d'obtenir des cassettes vidéo pirates et de regarder des films, tout cela, j'ai eu ces souvenirs distincts en grandissant et cela m'a toujours laissé le sentiment que l'accès à la technologie entraîne ce changement radical dans votre vie.

Lex Fridman

Je ne pense pas que vous puissiez un jour égaler la première fois où vous avez de l'eau chaude.

Sundar Pichai

Avoir cette commodité d'ouvrir un robinet et d'avoir de l'eau chaude qui en sort.

Lex Fridman

C'est intéressant, nous tenons pour acquis les progrès que nous avons accomplis. Si vous regardez l'histoire humaine, juste ces graphiques qui regardent le PIB sur 2 000 ans et vous voyez cette croissance exponentielle là où la plupart des progrès ont eu lieu depuis la révolution industrielle. Et nous tenons cela pour acquis, nous oublions d'où nous venons. Donc notre capacité à comprendre la chance que nous avons et aussi la rapidité avec laquelle la technologie peut s'améliorer est assez médiocre.

Sundar Pichai

C'est extraordinaire. Je retourne en Inde maintenant et la puissance du mobile est époustouflante de voir le progrès à travers l'arc du temps. C'est phénoménal.

Advice for the Youth and Leadership Philosophy

Lex Fridman

Quels conseils donneriez-vous aux jeunes qui écoutent cela dans le monde entier, qui vous admirent et trouvent votre histoire inspirante, qui veulent être le prochain Sundar Pichai, qui veulent lancer, créer des entreprises, construire quelque chose qui a beaucoup d'impact dans le monde ?

Sundar Pichai

On a beaucoup de chance en cours de route, mais il faut évidemment faire des choix intelligents. On réfléchit à ce qu'on veut faire et notre cerveau nous dit quelque chose. Mais quand on fait des choses, il est important d'écouter son cœur et de voir si on aime vraiment ce qu'on fait. Ce sentiment de faire ce qu'on aime, c'est tellement plus facile et on verra la meilleure version de soi-même. C'est plus facile à dire qu'à faire. Il est difficile de trouver des choses qu'on aime faire. Mais écouter son cœur un peu plus que son esprit pour savoir ce qu'on veut faire est l'une des meilleures choses que je dirais aux gens. La deuxième chose est d'essayer de travailler avec des gens que vous considérez, à différents moments de votre vie, comme meilleurs que vous. Vous êtes presque assis dans une pièce à parler à quelqu'un et vous êtes en admiration. Vous voulez ressentir cela quelques fois. Essayer de se mettre dans une position où vous travaillez avec des gens qui étirent vos capacités est ce qui vous aide à grandir. Se mettre dans des situations inconfortables permet souvent de se surprendre soi-même. Donc, être assez ouvert d'esprit pour se mettre dans ces positions est une autre chose que je dirais.

Lex Fridman

Quelles leçons pouvons-nous tirer d'un point de vue extérieur pour moi qui observe votre parcours et qui ai appris à vous connaître un peu ? Vous êtes humble, vous êtes gentil. Généralement, quand je pense à quelqu'un qui a eu un parcours comme le vôtre et qui grimpe au sommet du leadership, il est généralement dans un monde impitoyable, il va généralement être un peu un connard. Alors, quelle sagesse sommes-nous censés tirer du fait que votre approche générale est faite d'équilibre, d'humilité, de gentillesse, d'écoute de tout le monde ? Quel est votre secret ?

Sundar Pichai

Je me mets en colère, je suis frustré, j'ai les mêmes émotions que nous tous dans le contexte du travail et du reste. Avec le temps, j'ai trouvé la meilleure façon de tirer le meilleur des gens. On trouve des gens axés sur la mission qui participent à un voyage partagé, qui ont cette soif intérieure d'excellence. On motive les gens et on peut accomplir beaucoup de cette façon. Cela finit souvent par fonctionner ainsi. Y a-t-il eu des moments où j'ai craqué ? Oui, mais peut-être moins souvent que d'autres. Au fil des ans, de moins en moins, parce que je trouve que ce n'est pas nécessaire pour accomplir ce qu'on doit faire.

Lex Fridman

Donc péter les plombs n'a pas été productif.

Sundar Pichai

Le plus souvent, non. Je pense que les gens réagissent à cela. Ils peuvent faire des choses pour réagir, mais on veut en fait qu'ils fassent ce qu'il faut. Il y a un peu de sport là-dedans car je suis fan. Dans le football, les gens parlent souvent de gestion humaine. Il y a un élément de cela dans nos vies. Comment tirer le meilleur des personnes avec lesquelles on travaille ? Parfois, on travaille avec des gens qui sont si déterminés à réussir que s'ils ont fait quelque chose de mal, ils le ressentent plus que vous. Vous les traitez différemment des personnes occasionnelles à qui vous devez faire savoir clairement que ce n'était pas acceptable. Mais j'ai souvent trouvé que ce n'était pas le cas.

Lex Fridman

Et parfois les mots justes au bon moment, dits avec fermeté, peuvent résonner à travers le temps.

Sundar Pichai

Aussi, parfois, les mots non dits. Les gens peuvent parfois voir que vous n'êtes pas content sans que vous le disiez. Parfois, le silence peut délivrer ce message encore plus fort.

Greatness in Sports: Messi vs Ronaldo

Lex Fridman

Parfois, moins c'est plus. Qui est le plus grand joueur de football de tous les temps ? Messi ou Ronaldo ? Ou Pelé ou Maradona ?

Sundar Pichai

Je vais faire dans cette question...

Lex Fridman

Est-ce que ce sera une réponse politique ?

Sundar Pichai

Non, je vais dire la réponse honnête parce que...

Lex Fridman

C'est donc Messi. D'accord.

Sundar Pichai

C'est lui. C'est intéressant parce que mon fils est un grand fan de Cristiano Ronaldo. Et donc nous avons dû regarder des El Clasicos ensemble avec cette dynamique. J'admire tellement CR7. Je n'ai jamais vu un athlète aussi engagé envers ce genre d'excellence et il est l'un des plus grands de tous les temps. Mais pour moi, c'est Messi.

Lex Fridman

Quand je vois Lionel Messi, on est juste en admiration devant le fait que des humains soient capables d'atteindre un tel niveau de grandeur, de génie et d'art. Quand nous discuterons, nous parlerons d'IA, de robotique et de ce genre de choses. Ce niveau de génie, je ne suis pas sûr qu'on puisse l'égaler par l'IA avant longtemps. C'est un exemple de grandeur. On retrouve ce genre de grandeur dans d'autres disciplines, mais dans le sport on peut le voir visuellement mieux que n'importe quoi d'autre. Rien que le timing, le mouvement, c'est tout simplement du génie.

Sundar Pichai

J'ai eu la chance de le voir il y a quelques semaines. Il jouait à San José contre les Quakes, donc je suis allé voir le match. J'étais fan, j'avais de bonnes places, je savais où il jouerait en seconde période avec un peu de chance et même à son âge, rien qu'en le regardant quand il reçoit le ballon, ce mouvement, cette qualité spéciale. C'est difficile à décrire, mais on le sent quand on le voit.

AI as a Profound Productivity Multiplier

Lex Fridman

Il est toujours au top. Si nous classons toutes les innovations technologiques à travers l'histoire humaine, remontons à l'histoire de la civilisation humaine il y a 12 000 ans, et classons-les selon l'ampleur de leur multiplicateur de productivité. Nous pouvons prendre l'électricité ou la mécanisation du travail de la révolution industrielle ou remonter à la première révolution agricole il y a 12 000 ans. Dans cette longue liste d'inventions, pensez-vous que l'IA, quand l'histoire sera écrite dans 1 000 ans, a une chance d'être le multiplicateur de productivité numéro un ?

Sundar Pichai

C'est une excellente question. En 2017 ou 2018, j'ai dit que l'IA est la technologie la plus profonde sur laquelle l'humanité travaillera jamais. Elle sera plus profonde que le feu ou l'électricité. Je pense toujours que c'est le cas. Quand vous posez cette question, je me demandais si nous avions un biais de récence. Dans le sport, il est très tentant d'appeler la personne actuelle qu'on voit le plus grand joueur. Je pense qu'à partir de principes fondamentaux, l'IA sera plus importante que tout cela. Il y a deux ans, j'ai dû subir une opération chirurgicale et j'ai réalisé qu'à un moment donné, les gens n'avaient pas d'anesthésie. À ce moment-là, j'ai pensé que cela devait être la plus grande invention de l'humanité. Nous ne savons pas ce que c'était que de vivre à cette époque. Beaucoup de choses dont vous parlez étaient des choses générales qui affectaient tout, comme l'électricité ou Internet. Mais je ne pense pas que nous ayons déjà eu affaire à une technologie qui progresse aussi vite, qui devient aussi performante et qui s'auto-améliore de manière récursive. C'est la première technologie qui va accélérer radicalement la création elle-même. Je pense que cela la place dans une catégorie différente. L'impact qu'elle finira par avoir dépassera de loin tout ce que nous avons vu auparavant. Évidemment, cela s'accompagne de beaucoup de choses importantes à gérer, mais je pense vraiment que ce sera le cas.

Lex Fridman

Surtout si on arrive au point où l'on peut atteindre des performances surhumaines dans la recherche sur l'IA elle-même. C'est donc une technologie qui pourrait être capable d'atteindre un niveau où la technologie elle-même peut se créer mieux qu'elle ne le pouvait hier.

Sundar Pichai

C'est comme le coup 37 de la recherche Alpha. Quand elle pourra faire de la recherche novatrice et autodirigée, ce sont des questions complexes à aborder. Mais je pense que la technologie sous-jacente, regarder AlphaGo partir de zéro, être désemparé et devenir meilleur au cours d'une journée, cela vous frappe vraiment quand vous voyez cela se produire. Même nos modèles V-O-3, si vous échantillonnez les modèles quand ils étaient terminés à 30 % et à 60 % et que vous regardez ce qu'ils généraient, vous voyez comment tout s'assemble. C'est inspirant, un peu troublant, en tant qu'humain.

Lex Fridman

Eh bien, ce qui est intéressant avec la révolution industrielle, l'électricité comme vous l'avez mentionné, nous pouvons remonter là encore à la première révolution agricole. Il y a ce qu'on appelle l'ensemble néolithique, à savoir que ce n'est pas seulement que les nomades se sont sédentarisés et ont commencé à planter de la nourriture, mais que toute cette autre technologie est née de cela. Ce n'était pas un seul élément technologique, il y a ces effets d'entraînement, des effets de deuxième et troisième ordre. Tout, depuis quelque chose de profond comme la poterie qui peut stocker des liquides et de la nourriture, jusqu'à quelque chose que nous tenons pour acquis comme les hiérarchies sociales et les débuts de gouvernements. Parce que si les humains arrêtent de bouger et ont des surplus de nourriture, ils commencent à inventer des systèmes intéressants, puis le commerce émerge, ce qui s'avère être une chose vraiment profonde. Les effets de deuxième et troisième ordre incluant cet ensemble sont incroyables et probablement extrêmement difficiles à prédire si vous demandiez à l'une des personnes des tribus nomades. C'est difficile à prédire, mais tout cela étant dit, que pensez-vous être certaines des premières choses que nous pourrions voir dans l'ensemble de l'IA ?

Sundar Pichai

La plupart, nous ne le savons probablement pas aujourd'hui, mais la seule chose que nous pouvons commencer à voir concrètement maintenant, c'est évidemment avec les progrès du codage, on en a une idée. Il va être si facile d'imaginer des pensées dans sa tête et de les traduire en choses qui existent. Cela fera partie de l'ensemble. Cela va donner à presque toute l'humanité le pouvoir de s'exprimer. Peut-être que dans le passé on pouvait s'exprimer avec des mots, mais là on pourra donner naissance à des choses par la volonté. Nous en sommes aux premières étapes du « vibe coding ». J'ai été étonné de ce que les gens ont publié en ligne avec V-O-3, mais cela demande un peu de travail. Il faut assembler un ensemble d'invites (prompts). Mais tout cela va s'améliorer. La chose à laquelle je pense toujours, c'est que c'est le pire niveau qu'elle aura jamais, à n'importe quel moment donné.

Lex Fridman

C'est intéressant que vous ayez pensé à cela en premier. Donc, l'augmentation exponentielle de l'accès à la créativité, à la création de logiciels, au contenu partagé avec d'autres, aux jeux plus tard, tout cela devient infiniment plus possible.

Lex Fridman

Je pense que le plus important est que cela le rend accessible. Cela débloque les capacités cognitives des huit milliards d'individus.

Sundar Pichai

Je suis d'accord. Pensez à il y a 40 ans, peut-être qu'aux États-Unis il y avait cinq personnes capables de faire ce que vous faisiez. Mais aujourd'hui avec YouTube et d'autres produits, combien de personnes en plus le font. C'est ce que fait la technologie. Quand Internet a créé les blogs, on a entendu parler de tellement plus de gens. Mais avec l'IA, je pense que ce nombre ne sera pas de l'ordre de centaines de milliers, ce sera des dizaines de millions de personnes, peut-être même un milliard de personnes publiant des choses dans le monde de manière plus profonde.

The Future of Creativity and Content

Lex Fridman

Et je pense que cela changera le paysage de la créativité et que cela rend beaucoup de gens nerveux. Par exemple, Fox, MSNBC, CNN sont vraiment nerveux à propos de ce scénario. YouTube et des milliers d'autres créateurs peuvent faire le même genre de choses. Cela les rend nerveux. Et maintenant on a un podcast de NotebookLM qui est meilleur que n'importe quel podcast que j'ai jamais fait.

Sundar Pichai

Pas vrai, mais...

Lex Fridman

Je plaisante pour l'instant, mais peut-être pas. Et cela change, il faut évoluer. S'il y a de super podcasts qui sont tous les deux des IA, j'arrêterai de faire ce podcast et j'écouterai ce podcast-là. Mais il faut évoluer et changer et cela rend les gens vraiment nerveux. Mais c'est aussi un avenir vraiment excitant.

Sundar Pichai

La seule chose que je pourrais dire, c'est que je pense que dans un monde où il y a deux IA, les gens apprécient et choisissent, tout comme aux échecs. Nous ne regarderions jamais Stockfish 10 et AlphaGo jouer l'un contre l'autre, ce serait ennuyeux. Mais Magnus Carlsen et Gukesh, cette partie serait bien plus fascinante. Une façon de dire est que vous aurez beaucoup plus de contenu et que vous écouterez du contenu généré par l'IA parce que c'est efficace. Mais les expériences premium que vous appréciez pourraient être une version de l'essence humaine partout où elle transparaît, pour en revenir au fait de regarder Messi dribbler le ballon. Un jour, je suis sûr qu'une machine dribblera bien mieux que Messi, mais je ne sais pas si cela évoquerait la même émotion en nous. Ce sera fascinant à voir.

Lex Fridman

Je pense que l'élément du podcasting ou des livres audio qui concerne la collecte d'informations pourrait être réalisé de manière plus efficace et convaincante par l'IA. Mais ensuite, ce sera tout simplement agréable d'entendre des humains se débattre avec l'information, la combiner avec la complexité de nos propres émotions et de notre conscience. Si on veut s'informer sur un pan de l'histoire, on va sur Gemini. Si on veut voir Lex se débattre avec cette histoire, alors on regarde ça. Cela va continuer à changer la nature de la façon dont nous découvrons, consommons et créons l'information. De la même manière que YouTube a tout changé complètement et a changé l'actualité, c'est quelque chose avec lequel notre société est en difficulté.

Sundar Pichai

YouTube a permis l'émergence de tant de créateurs. Il ne fait aucun doute pour moi que nous permettrons à plus de cinéastes qu'il n'y en a jamais eu. On va donner du pouvoir à beaucoup plus de gens. Il y a un aspect expansionniste à cela qui est sous-estimé. Cela va libérer la créativité humaine d'une manière jamais vue auparavant. C'est difficile à intérioriser. Si on amenait quelqu'un des années 40 et qu'on le mettait devant YouTube, il serait époustouflé. De même, je pense que nous serions époustouflés par ce qui sera possible dans un délai de 10 à 20 ans.

Lex Fridman

Pensez-vous qu'il y ait un avenir où, disons, 50 % du contenu convaincant et bon soit généré par V-O-4, 5, 6 ?

Sundar Pichai

Je pense que cela dépend de l'usage. Comme les films aujourd'hui avec les images de synthèse (CGI), il y a de grands cinéastes, on regarde toujours qui sont les réalisateurs. Il y a des cinéastes qui ne les utilisent pas du tout et on apprécie cela. Il y a des gens qui les utilisent de manière incroyable, comme James Cameron. Mais je pense qu'il y aura beaucoup plus de contenu créé. Les écrivains aujourd'hui utilisent Google Docs et ne pensent pas au fait qu'ils utilisent un outil comme celui-là. Les gens utiliseront la version future de ces choses, ce ne sera pas du tout un problème pour eux.

Lex Fridman

J'ai eu l'occasion de bien connaître Darren Aronofsky. Il s'y intéresse vraiment et essaie de comprendre comment l'IA peut être utilisée pour créer des films convaincants. Aronofsky et les frères Dor créent à la limite de la fenêtre d'Overton de la société, ils repoussent les limites qu'il s'agisse de sexualité ou de violence. C'est osé mais ça reste classe. Hunter S. Thompson a cette phrase qui dit que la seule façon de savoir où se trouve la ligne est de la franchir. Pour les artistes c'est vrai, c'est leur but. Je me demande si vous pouvez commenter la position étrange dans laquelle cela place Google, car la ligne de Google est probablement différente de celle de certains de ces artistes. Comment pensez-vous que V-O et Flow permettent aux artistes de faire des trucs de fous, mais aussi la responsabilité pour que ce ne soit pas trop fou ?

Sundar Pichai

C'est un visionnaire évident. Une partie de la raison pour laquelle nous avons commencé à travailler avec lui tôt sur V-O est qu'il fait partie de ces personnes capables de voir cet avenir et de montrer la voie sur la façon dont les créatifs peuvent s'exprimer avec. Permettre la libre expression artistique est l'une des valeurs les plus importantes d'une société. Les artistes ont toujours été ceux qui repoussent les limites et élargissent les frontières de la pensée. Nous fournirons des outils et les mettrons entre les mains des artistes pour qu'ils les utilisent et publient leur travail. Je considère ces API comme des infrastructures. Tout comme lorsque vous fournissez de l'électricité, vous voulez qu'ils l'utilisent et vous ne pensez pas aux cas d'utilisation par-dessus. C'est un pinceau. La société doit décider à un niveau fondamental de ce qui est acceptable et de ce qui ne l'est pas. Nous serons responsables avec cela. Mais quand il s'agit de libre expression artistique, je pense que c'est l'une de ces valeurs que nous devrions travailler dur pour défendre.

Gemini, AI Safety, and Nuance

Lex Fridman

Les versions précédentes de Gemini étaient un peu prudentes sur le genre de choses auxquelles elles acceptaient de répondre. J'ai été agréablement surpris que Gemini 1.5 Pro soit beaucoup moins prudent, dans le bon sens du terme. J'ai fait beaucoup de recherches sur Gengis Khan et les Aztèques et la Première Guerre mondiale et la Seconde Guerre mondiale. Les versions précédentes de Gemini étaient très du genre « Êtes-vous sûr de vouloir en savoir plus sur ce sujet ? » Maintenant, c'est très factuel, objectif, et cela parle des parties difficiles de l'histoire humaine avec nuance et profondeur. Mais il y a une ligne là que Google doit suivre. C'est aussi un défi d'ingénierie, comment faire cela à grande échelle à travers toutes les requêtes bizarres que les gens posent. Comment permettez-vous à Gemini de dire des trucs de dingues, mais pas trop dingues ?

Sundar Pichai

À mesure que les modèles deviennent plus performants, ils sont vraiment doués pour ce genre de choses. Il y a un an, les modèles n'étaient pas tout à fait au point, ils faisaient donc des choses stupides plus souvent. On essaie de gérer ces cas limites, mais ensuite on fait une erreur dans la façon dont on les gère et cela s'amplifie. Avec la 1.5, ce que nous avons constaté, c'est qu'une fois que les modèles dépassent un certain niveau d'intelligence, ils sont capables de raisonner sur ces questions nuancées assez bien. Les utilisateurs veulent vraiment cela. On veut avoir autant accès au modèle brut que possible. Avec le temps, nous devrions permettre un accès de plus en plus direct et laisser les gens expérimenter avec. Mais d'un point de vue scientifique, s'assurer que les modèles raisonnent sur le monde à partir de principes fondamentaux et sont nuancés est la bonne façon de construire ces choses, et non pas un sous-ensemble d'humains qui codent des choses en dur par-dessus. C'est la direction que nous avons prise et vous nous verrez continuer à pousser dans cette direction.

Lex Fridman

J'ai donné mes notes détaillées à Gemini et j'ai dit : « Peux-tu poser une question originale qui ne figure pas dans ces notes ? » Cela m'a vraiment surpris. La question qu'il a générée était : « Vous avez dit au monde que Gemini produit 480 billions de jetons par mois. Quelle est la phrase de cinq mots la plus capable de changer une vie cachée dans cette botte de foin ? » Cela m'a donné le sentiment que tous ces jetons procurent des petits moments de révélation pour les gens à travers le monde. Les gens sont curieux, ils posent une question et découvrent quelque chose et cela pourrait vraiment changer leur vie.

Sundar Pichai

J'ai eu le même sentiment à propos de la recherche il y a de nombreuses années. Ce nombre de jetons par mois a été multiplié par 50 au cours des 12 derniers mois. C'était 9,7 billions de jetons par mois il y a 12 mois et c'est monté à 480. Il n'y a pas de limite à la curiosité humaine. Peut-être qu'un jour il y aura une phrase de cinq mots qui dira ce qu'est réellement l'univers ou quelque chose de très significatif, mais je ne pense pas que nous en soyons tout à fait là.

Scaling Laws, AGI, and AJI

Lex Fridman

Pensez-vous que les lois de mise à l'échelle (scaling laws) tiennent bon sur les fronts du pré-entraînement et du post-entraînement ? Anticipez-vous que les progrès de l'IA vont heurter un mur ?

Sundar Pichai

C'est une conversation de micro-cuisine prisée de temps en temps. Nous nous asseyons et en discutons. Nous voyons beaucoup de marge de progression devant nous. Nous avons pu optimiser et nous améliorer sur tous les fronts : pré-entraînement, post-entraînement, calcul au moment du test et rendre ces modèles plus agentiques. Faire en sorte que ces modèles soient des modèles de monde plus généraux, comme V-O-3, la compréhension de la physique est nettement meilleure. Les progrès sont très évidents à voir. J'ai l'impression qu'il y a une marge de progression significative et j'ai la chance de travailler avec certains des meilleurs chercheurs de la planète qui pensent qu'il y a encore de la marge. Nous avons une trajectoire passionnante devant nous. Chaque année, je dit que nous allons allouer 10 fois plus de puissance de calcul l'année prochaine et verrons-nous des progrès ? En étant ici aujourd'hui, j'ai le sentiment que l'année à venir connaîtra beaucoup de progrès.

Lex Fridman

Et ressentez-vous des limitations ou des goulots d'étranglement : limitation par le calcul, par les données, par les idées ? Est-ce que c'est à plein régime sur tous les fronts ?

Sundar Pichai

Je pense qu'il y a une limitation par le calcul dans ce sens. Une partie de la raison pour laquelle vous nous avez vu faire des modèles Flash, Nano et Pro mais pas un modèle Ultra est que pour chaque génération, nous avons le sentiment d'avoir pu amener le modèle Pro à 80-90 % de la capacité de l'Ultra, mais l'Ultra serait beaucoup plus lent et plus cher à exploiter. Ce que nous avons pu faire, c'est passer à la génération suivante et rendre le Pro de la génération suivante aussi bon que l'Ultra de la génération précédente, mais en le servant d'une manière rapide. Je pense que les lois de mise à l'échelle fonctionnent, mais les modèles que nous utilisons tous le plus ont peut-être quelques mois de retard sur la capacité maximale que nous pouvons fournir car ce ne serait pas le plus rapide ou le plus facile à utiliser.

Lex Fridman

De plus, en termes d'intelligence, il devient de plus en plus difficile de mesurer les performances parce que Gemini Flash a beaucoup plus d'impact que Pro juste à cause de la latence. Parfois, la latence est plus importante que l'intelligence, surtout quand l'intelligence est juste un peu moindre dans Flash. Maintenant, les tests de performance (benchmarks) sont de moins en moins capables de capturer l'intelligence, l'efficacité et l'utilité réelle des modèles. Une autre question de cuisine, les gens parlent des délais pour l'AGI ou l'ASI, la superintelligence artificielle. Quand pensez-vous que nous aurons l'AGI ? Est-ce que 2030 est une possibilité ?

Sundar Pichai

Il y a un autre terme que nous devrions introduire : l'IA en dents de scie (AJI - artificial jagged intelligence). Parfois, on a cette impression, où il y a des progrès et on voit ce qu'ils peuvent faire, puis ils font des erreurs numériques ou comptent les R dans « strawberry », ce qui fait trébucher la plupart des modèles. J'ai l'impression que nous sommes dans la phase AJI où il y a des progrès spectaculaires mais certaines choses ne fonctionnent pas bien. Si votre question est de savoir si cela arrivera d'ici 2030, nous déplaçons constamment la ligne de ce que signifie être une AGI. Assis dans une Waymo dans une rue de San Francisco, j'en vois des aperçus. La voiture est parfois un peu impatiente, en utilisant Astra dans Gemini Live ou en posant des questions sur le monde.

Inconnu

C'est quoi cet immeuble tout fin dans mon quartier ?

Gemini Live

C'est un lampadaire, pas un immeuble.

Sundar Pichai

On voit des aperçus. C'est pourquoi j'utilise le mot AJI parce qu'on voit aussi des trucs pour lesquels nous sommes manifestement encore loin de l'AGI aussi. J'ai presque l'impression que le terme n'a pas d'importance. D'ici 2030, il y aura des progrès tellement spectaculaires que nous devrons faire face aux conséquences, tant les externalités positives que négatives. J'en suis fermement convaincu. Les progrès seront spectaculaires.

Lex Fridman

L'IA pensera-t-elle avoir atteint l'AGI d'ici 2030 ?

Sundar Pichai

Je dirais que nous serons juste un peu en deçà de cette échéance, cela prendra un peu plus de temps. Aux débuts de Google DeepMind en 2010, ils parlaient d'un horizon de 20 ans pour atteindre l'AGI. Pour moi, voir ce que Google Brain a fait en 2012 quand Jeff Dean a montré que les réseaux neuronaux pouvaient reconnaître une photo de chat, nous parlions tous de quelques décennies. Je ne pense pas que nous y serons tout à fait d'ici 2030, donc mon sentiment est que c'est un peu après cela. Mais je soulignerais que cette définition n'a pas d'importance parce que vous aurez des progrès époustouflants sur de nombreuses dimensions. Peut-être que l'IA pourra créer des vidéos, nous devons trouver en tant que société comment nous convenons que cela est généré par l'IA et le divulguer d'une certaine manière parce que comment distinguer la réalité autrement ?

Lex Fridman

Il y a tellement de choses intéressantes que vous avez dites. En regardant en arrière, ce passé récent ressemble maintenant à de l'histoire ancienne avec Google Brain, c'était avant que TensorFlow ne soit rendu public. L'outillage compte aussi, combiné à la capacité de GitHub à partager du code. Ensuite, vous avez les idées des transformateurs d'attention et de la diffusion, puis il pourrait y avoir une nouvelle idée qui semble simple rétrospectivement mais qui changera tout, comme le post-entraînement et les innovations au moment de l'inférence. Google n'est qu'à une excellente interface utilisateur de gagner complètement la course à l'IA, ce qui signifie que l'interface utilisateur est une part énorme de tout ça. Quand cela va-t-il devenir un système où l'on parle de livrer des systèmes plutôt que de livrer le modèle en particulier ? Cela compte vraiment, la façon dont le système se manifeste au monde.

Sundar Pichai

Énormément. De simples innovations d'interface utilisateur ont changé le monde. Nous verrons beaucoup plus de progrès dans les deux prochaine années car l'IA elle-même est sur une voie d'auto-amélioration pour l'interface utilisateur. Aujourd'hui, nous contraignons les modèles, mais étant donné que ces modèles savent coder, ils devraient être capables d'écrire les meilleures interfaces pour exprimer leurs idées au fil du temps.

Lex Fridman

C'est une idée incroyable. Leurs API sont déjà ouvertes, vous pourriez donc créer un système agentique vraiment performant qui améliore continuellement la façon dont on parle à une IA. Une grande partie de cela réside dans l'interface et l'aspect multimodal incroyable que Google a poussé.

Sundar Pichai

Ces modèles sont nativement multimodaux, ils peuvent facilement prendre du contenu de n'importe quel format et le mettre dans n'importe quel format. Ils peuvent écrire une bonne interface utilisateur et ils comprennent probablement mieux vos préférences au fil du temps. Tout cela est l'évolution à venir. Il y aura des évolutions spectaculaires dans les années à venir.

p(doom) and Human Resilience

Lex Fridman

Peut-être une autre question de cuisine : le concept ridicule de p(doom). Les personnes à l'esprit philosophique de la communauté de l'IA réfléchissent à la probabilité que l'AGI puis l'ASI détruisent toute la civilisation humaine. Je dirais que mon p(doom) est d'environ 10 %. Est-ce que vous pensez parfois à ce genre de menace à long terme de l'ASI et quel serait votre p(doom) ?

Sundar Pichai

J'ai à la fois été très enthousiasmé par l'IA, mais j'ai toujours eu le sentiment que c'est une technologie dont nous devons activement réfléchir aux risques et travailler très dur pour la maîtriser afin que tout se passe bien. Sur la question du p(doom), c'est une autre conversation de micro-cuisine qui surgit de temps en temps étant donné la puissance de la technologie. Quand on dirige une grande organisation, si on peut aligner les incitations de l'organisation, on peut accomplir à peu près n'importe quoi. Si on peut faire marcher les gens vers un objectif de manière très concentrée et axée sur la mission, on peut tout accomplir. Mais il est très difficile d'organiser toute l'humanité de cette façon. Mais je pense que si p(doom) est réellement élevé, à un moment donné, toute l'humanité s'alignera pour s'assurer que ce ne soit pas le cas. Nous ferons réellement plus de progrès contre cela. L'ironie est qu'il y a un aspect d'auto-modulation là-dedans. Si l'humanité met collectivement tout son esprit à résoudre un problème, je pense que nous pouvons y arriver. Pour cette raison, je pense être optimiste quant aux scénarios p(doom). Cela ne signifie pas que le risque sous-jacent n'est pas assez élevé, mais j'ai une grande confiance dans le fait que l'humanité se soulèvera pour faire face à ce moment.

Lex Fridman

À mesure que la menace devient plus concrète et réelle, les humains se rassemblent vraiment et s'organisent. L'autre chose dont les gens ne parlent pas souvent, c'est la probabilité de catastrophe sans l'IA. Il y a toutes ces autres façons dont les humains peuvent se détruire eux-mêmes et il est très possible que l'IA nous aide à devenir plus intelligents, plus gentils les uns envers les autres, plus efficaces, et aide davantage de parties du monde à prospérer là où elles seraient moins limitées par les ressources. Nous devons également intégrer dans cela ce qu'est le p(doom) sans l'IA car il est très possible que l'IA soit la chose qui sauve la civilisation humaine de toutes les autres menaces.

Sundar Pichai

Je suis d'accord avec vous. Je pense que c'est perspicace. Pour progresser sur certains des problèmes les plus difficiles, il serait bon d'avoir l'IA pour vous aider. Cela résonne en moi, c'est certain.

Google Beam and Human Connection

Lex Fridman

Petite pause, pause toilettes ?

Sundar Pichai

Allons-y.

Lex Fridman

D'accord, faisons ça.

Lex Fridman

Si NotebookLM était convaincant de la même manière, Beam m'a époustouflé. C'était incroyable. Je ne pensais pas qu'il était possible de réussir cela.

Sundar Pichai

Un jour, mon espoir est que le président américain et le président chinois puissent faire quelque chose comme Beam avec la traduction en direct fonctionnant bien, afin qu'ils parlent tous les deux et progressent.

Lex Fridman

Pour les personnes qui nous écoutent, nous avons fait une petite pause toilettes et maintenant nous parlons de la démo que j'ai faite. J'ai eu la chance de découvrir Beam et c'est difficile de décrire avec des mots à quel point cela semblait réel avec seulement six caméras. C'est incroyable.

Sundar Pichai

C'est l'un des produits les plus difficiles car on ne peut pas vraiment le décrire aux gens. Il faut en faire l'expérience.

Lex Fridman

Sur le front des leaders mondiaux, il y a quelque chose de vraiment spécial, là encore en étudiant la Seconde Guerre mondiale et tout ce qui aurait pu être sauvé si Chamberlain avait rencontré Staline en personne. J'ai parfois du mal à expliquer pourquoi je crois que se rencontrer en personne pour les leaders mondiaux est puissant. Il semble naïf de dire cela mais il y a quelque chose là, en personne. Avec Beam j'ai ressenti la même chose et je suis incapable de l'expliquer. Tout ce que je n'arrête pas de faire c'est ce que fait un enfant, dire que vous avez l'air réel. Je ne sais pas si cela rend les réunions plus productives, mais cela les rend certainement plus axées sur cette connexion humaine. Il y a quelque chose de beau dans le fait que de grandes équipes collaborent sur une chose qui n'est pas capturée par la productivité ou ce qui est sur le papier. Certains des plus beaux moments que l'on vit dans la vie sont au travail en poursuivant une chose difficile ensemble pendant plusieurs mois.

Sundar Pichai

On est dans les tranchées et on forme des liens de cette façon.

Lex Fridman

Pouvoir faire cela à distance avec cette même touche personnelle est une chose profondément gratifiante. Personnellement, je déteste les réunions parce qu'un pourcentage important de réunions, quand elles sont mal faites, ne servent pas un but clair. Mais c'est un problème de réunion, pas un problème de communication. Si on peut améliorer la communication pour les réunions qui sont utiles, c'est tout simplement incroyable. J'ai été époustouflé par l'ingénierie derrière tout ça et ensuite on peut voir quel impact cela a.

Sundar Pichai

Nous travaillerons dur au fil des ans pour le rendre de plus en plus accessible. En dehors des réunions de travail, imaginez une grand-mère qui est loin de son petit-enfant et qui peut avoir ce genre d'interaction. Rien ne remplace le fait d'être en personne mais ce n'est pas toujours possible, comme un soldat déployé essayant de parler à son être cher. C'est ce qui nous inspire.

Leading Google Through the AI Race

Lex Fridman

Quand nous avons passé du temps ensemble l'année dernière, en dehors de cela, j'ai vu des dizaines d'articles écrits par des experts disant que Sundar Pichai devrait démissionner parce que la perception était que Google perdait la course à l'IA. Maintenant, un un plus tard, c'est fou. Vous avez montré ce graphique de toutes les choses qui ont été livrées au cours de l'année écoulée et Gemini Pro gagne dans de nombreux tests de performance et produits. Parlez-moi de cette expérience quand il y avait tous ces articles disant que vous n'étiez pas la bonne personne pour diriger Google dans cette épreuve, jusqu'à aujourd'hui où Google gagne à nouveau. Quels ont été les points bas durant cette période ?

Sundar Pichai

Le principal pari que j'ai fait en tant que PDG était de m'assurer que l'entreprise abordait tout d'une manière centrée sur l'IA et que nous nous préparions à développer l'AGI de manière responsable et à sortir des produits qui incarnent des choses utiles pour les gens. Je savais même à travers ces moments l'année dernière ce que nous construisions en interne. J'avais pris de nombreuses décisions importantes comme rassembler des équipes du calibre de Brain et DeepMind et créer Google DeepMind. Nous avons pris la décision d'investir dans les TPU il y a 10 ans, nous savions donc que nous passions à l'échelle supérieure et construisions de grands modèles. Je suis doué pour ignorer le bruit et séparer le signal du bruit. Parfois, on saute dans l'océan et c'est tellement agité, mais on descend d'un pied sous l'eau et c'est la chose la plus calme. En dirigeant Google, on pourrait tout aussi bien entraîner le FC Barcelone ou le Real Madrid. On peut avoir une mauvaise saison. Mais je suis doué pour ignorer le bruit. Je guette les signaux parce qu'il est important de séparer le signal du bruit. Il y a des gens bien qui font valoir des points valables à l'extérieur, donc on veut prendre ces commentaires en compte. Mais en interne, on prend un ensemble de décisions lourdes de conséquences. La plupart des décisions que l'on prend au jour le jour n'ont pas d'importance et on les prend juste pour que les choses continuent d'avancer. Mais il faut prendre quelques décisions lourdes de conséquences. Nous avions mis en place les bonnes équipes et les bons leaders, nous avions des chercheurs de classe mondiale, nous formions Gemini. En interne, il y a des facteurs que les gens à l'extérieur n'ont peut-être pas appréciés. Les TPU sont incroyables mais nous avons dû monter en puissance sur les TPU aussi et passer à l'échelle pour avoir assez de TPU pour obtenir le calcul nécessaire. Mais je pouvais voir en interne la trajectoire sur laquelle nous étions et j'étais enthousiasmé par la possibilité. Ce moment semblait être l'une des plus grandes opportunités pour nous en tant qu'entreprise. L'espace d'opportunités à venir au cours des 20 prochaines années est plus grand que ce qui s'est passé dans le passé et je pensais que nous étions mieux préparés que la plupart des entreprises au monde pour concrétiser cette vision.

Lex Fridman

Je veux dire que vous avez dû prendre des décisions audacieuses et lourdes de conséquences, comme la fusion de DeepMind et Brain. J'ai sûr qu'il y a beaucoup d'egos impliqués et de décisions difficiles à prendre. Pouvez-vous m'expliquer votre processus, comment vous y réfléchissez et prenez cette décision ? Quels ont été certains points douloureux et comment avez-vous navigué dans ces eaux turbulentes ?

Sundar Pichai

Nous avons eu la chance d'avoir deux équipes de classe mondiale, mais c'est comme si quelqu'un vous disait de prendre Stanford et le MIT et de les réunir pour créer un excellent département. Plus facile à dire qu'à faire. Mais nous avons eu de la chance, des équipes phénoménales, les deux avaient leurs forces. Brain était constitué de nombreux projets divers et il en est sorti d'importantes percées en recherche. DeepMind à l'époque avait une vision forte de la façon dont on veut construire l'AGI. Mais à travers ces moments, Jeff avait exprimé le désir de revenir à des racines de contributeur individuel scientifique car il sentait que le management lui prenait trop de temps. Demis dirigeait DeepMind et était un choix naturel là-bas. Il nous a fallu un certain temps pour réunir les équipes, tout le mérite en revient à Demis, Jeff, Koray et tous les gens là-bas. Ils ont travaillé super dur pour combiner le meilleur des deux mondes. Quelques nuits blanches ici et là pendant que nous mettions cela en place. Nous avons été patients dans la façon dont nous l'avons fait afin que cela fonctionne bien sur le long terme. Avec les choses qui bougent vite, on ressentait certainement la pression, mais je pense que nous avons réussi cette transition et ils font manifestement un travail incroyable et il y a beaucoup d'autres choses incroyables à venir de leur part.

Lex Fridman

Comme nous en avons parlé, vous avez un comportement très calme et respectueux. Pendant cette période, qu'il s'agisse de la fusion ou simplement de la gestion du bruit, y a-t-il eu des moments où la frustration a débordé ? Avez-vous dû être un peu plus intense avec tout le monde que vous ne l'êtes d'habitude ?

Sundar Pichai

Probablement dans le sens où c'était un moment où nous poussions tous très fort. Quand on travaille avec passion dans les tranchées, on a forcément des jours où on n'est pas d'accord et où on se dispute, mais cela fait partie du processus de travail intense. Au bout du compte, nous faisons tous ce que nous faisons à cause de l'impact que cela peut avoir. Pour beaucoup d'entre nous, cela a été un voyage à long terme et cela a été super excitant. Les moments positifs l'emportent de loin sur les moments stressants. Juste au début de cette année, j'ai eu la chance de célébrer le prix Nobel pour Jeff Hinton et le lendemain un prix Nobel pour Demis et John Jumper. Vous travaillez avec des gens comme ça et c'est super inspirant.

Lex Fridman

Y a-t-il un moment où vous avez dû taper du poing sur la table en disant : « Je suis le PDG et nous faisons cela » ?

Sundar Pichai

Pour en revenir à mon point précédent sur les décisions lourdes de conséquences que l'on prend, il y a des décisions que l'on prend où les gens peuvent être en désaccord véhément, mais à un moment donné, on prend une décision claire et on demande simplement aux gens de s'engager. Il est temps de dire « être en désaccord et s'engager » (disagree and commit) pour que nous puissions avancer. Que ce soit taper du poing sur la table ou non, c'est une partie naturelle de ce que nous devons tous faire et on peut faire cela calmement et être très ferme sur la direction. Si on est clair, les gens finissent par respecter cela. Si on peut prendre des décisions avec clarté, je trouve qu'il est très efficace dans les réunions d'écouter tout le monde. Il est important d'écouter tout le monde. Parfois, ce qu'on entend influence réellement la façon dont on réfléchit, on pèse le pour et le contre et on prend une décision. Parfois, on a une conviction claire et on l'énonce et on passe à autre chose.

Lex Fridman

Y a-t-il de grandes décisions comme celle-là ? Je suppose intuitivement que la fusion était la plus importante.

Sundar Pichai

Je pense que c'était une décision très importante pour que l'entreprise soit à la hauteur de l'événement. Je pense que c'était une décision lourde de conséquences. Il y avait beaucoup d'autres choses, nous avons mis en place une équipe d'infrastructure d'IA pour vraiment répondre au moment présent pour augmenter la puissance de calcul dont nous avions besoin et nous avons réuni des équipes de différentes parties de l'entreprise pour aller de l'avant. Faire travailler les gens ensemble physiquement à la fois à Londres avec DeepMind et ce que nous appelons Gradient Canopy, qui est l'endroit où se trouvent les équipes de Google DeepMind de Mountain View. L'un de mes moments préférés est quand je marche régulièrement plusieurs fois par semaine vers le bâtiment Gradient Canopy où nos meilleurs chercheurs travaillent sur les modèles. Sergey est souvent là parmi eux, cherchant simplement à obtenir une mise à jour sur les modèles. La partie culturelle consistant à réunir les équipes avec cette énergie a fini par jouer un grand rôle aussi.

The Evolution of Google Search

Lex Fridman

Qu'en est-il de la décision d'ajouter récemment le mode IA ? Google Search est ce truc minimaliste légendaire avec 10 liens bleus. Maintenant, vous commencez à toucher à ça. Le mode IA est un onglet séparé et l'intégration de l'IA dans les résultats, je suis sûr qu'il y a eu des batailles en réunion sur ce point.

Sundar Pichai

Quand le mobile est arrivé, les gens voulaient des réponses à plus de questions, nous l'avons donc fait évoluer constamment. Cette évolution, parce que la technologie sous-jacente devient beaucoup plus performante, permet à l'IA de donner beaucoup de contexte. L'un de nos objectifs de conception importants est que lorsque vous venez sur Google Search, vous allez obtenir beaucoup de contexte mais vous allez aller chercher des choses sur le Web. Ce sera vrai en mode IA, dans les aperçus IA et ainsi de suite. Nous vous donnons toujours accès à des liens, mais considérez l'IA comme une couche qui vous donne du contexte ou un résumé. En mode IA, vous pouvez avoir un dialogue avec elle tout au long de votre parcours. À travers cela, vous apprenez ce qu'il y a là-bas dans le monde. Ces principes fondamentaux ne changent pas, mais le mode IA nous permet de pousser les meilleurs modèles là-bas, en utilisant la recherche comme un outil profond qui se déploie, effectue plusieurs recherches et assemble ces connaissances d'une manière qui vous permet d'aller consommer ce que vous voulez.

Lex Fridman

J'ai eu l'occasion d'écouter Elizabeth Reid décrire cela. Deux choses m'ont frappé. L'une est la ventilation de la requête (query fan-out) qui est l'aspect puissant consistant à intégrer un tas de choses sur le Web pour vous en un seul endroit. Cela fournit ce contexte afin que vous puissiez décider vers quelle page vous diriger ensuite. L'autre chose vraiment importante concerne le multiplicateur de productivité, à savoir qu'à travers le mode IA pour les non-anglophones, vous rendez les sites Web en langue anglaise accessibles dans le processus de raisonnement. Bien sûr, une fois arrivé sur une page, on peut utiliser une traduction de base, mais ce processus de compréhension — si on fait preuve d'empathie envers une grande partie du monde qui ne parle pas anglais — leur Web est beaucoup plus petit. Et donc cela débloque cette énorme capacité cognitive parce que Gemini est vraiment doué pour la traduction.

Sundar Pichai

La multimodalité, la traduction, sa capacité de raisonnement — nous améliorons considérablement l'utilisation des outils. Mettre cette puissance dans le flux de recherche, cela m'enthousiasme énormément. Avec les aperçus IA, nous avons vu que le produit est devenu bien meilleur et nous le mesurons à l'aide de toutes sortes d'indicateurs d'utilisateurs. Cela a manifestement entraîné une forte croissance du produit et nous avons testé le mode IA, il est maintenant entre les mains de millions de personnes et les premiers indicateurs sont très encourageants. Je suis enthousiaste pour ce prochain chapitre de la recherche.

Lex Fridman

Il y a les 10 liens bleus avec l'aperçu IA au-dessus qui fournit un bon résumé avec des sources et des liens intégrés. Je crois qu'il y a aussi des publicités dans l'aperçu IA. Je ne pense pas qu'il y ait de publicités en mode IA. Dans les années 90, je me souviens des bannières animées en GIF qui vous emmenaient vers des sites Web louches. AdSense a révolutionné la publicité. Cela nous permet d'avoir accès gratuitement à tous ces types de services. Les publicités alimentent beaucoup de services très puissants. Quand pensez-vous qu'il sera possible d'ajouter des publicités en mode IA et à quoi cela ressemblera-t-il d'un point de vue élégant et non ennuyeux ?

Sundar Pichai

Au début, le mode IA se concentrera davantage sur l'expérience organique pour s'assurer que nous faisons les choses correctement. La valeur fondamentale des publicités est qu'elles permettent l'accès pour déployer les services à des milliards de personnes. Nous avons toujours pris les publicités au sérieux et nous les considérons comme des informations commerciales. Nous y appliquons les mêmes critères de qualité. Avec le mode IA, l'IA elle-même nous aidera au fil du temps à trouver la meilleure façon de le faire. Étant donné que nous donnons du contexte autour de tout, je pense que cela nous donnera plus d'opportunités d'expliquer également les informations commerciales. En tant que podcasteur, vous le faites à certains moments et vous déterminez probablement ce qui est le mieux dans votre podcast. Le besoin fondamental des gens d'accorder de l'importance aux informations commerciales et des entreprises d'essayer de se connecter aux utilisateurs ne change pas dans un moment d'IA. Nous allons y repenser. Vous nous avez vus sur YouTube faire un mélange d'abonnement et de publicité. Nous introduisons maintenant des offres d'abonnement sur tout. Dans ce cadre, nous pouvons également optimiser à différents endroits.

Lex Fridman

Voyez-vous une trajectoire dans l'avenir possible où le mode IA remplacerait complètement les 10 liens bleus plus l'aperçu IA ?

Sundar Pichai

Notre plan actuel est que le mode IA soit là comme un onglet séparé pour les personnes qui veulent vraiment faire cette expérience. Mais il n'est pas encore au niveau de notre page de recherche principale. Mais à mesure que les fonctionnalités fonctionnent, nous continuerons à les migrer vers la page principale. Vous pouvez le voir comme un continuum. Le mode IA vous offrira l'expérience de pointe, mais les choses qui fonctionnent continueront de déborder sur les aperçus IA et l'expérience principale.

Lex Fridman

Et l'idée que le mode IA vous amènerait toujours vers le Web, vers le Web créé par des humains.

Sundar Pichai

Oui, ce sera un principe de conception fondamental pour nous.

Lex Fridman

Donc vraiment si les utilisateurs décident, n'est-ce pas ? Ce sont eux qui dirigent cela.

Sundar Pichai

Ouais.

Lex Fridman

C'est juste excitant et un peu effrayant que cela puisse changer Internet parce que Google a dominé avec un look et une idée très spécifiques de ce que signifie avoir Internet. À mesure que vous passez au mode IA, c'est simplement une expérience différente. Elizabeth parlait de la façon dont on pose plus de questions et des questions plus longues.

Sundar Pichai

Des types de questions radicalement différents.

Lex Fridman

Cela alimente en fait la curiosité. J'ai posé un nombre beaucoup plus important de questions à cette boîte noire. Avec l'aperçu IA c'est intéressant parce que j'apprécie toujours l'humain et je veux toujours en fin de compte me retrouver sur le Web créé par des humains. Mais le contexte aide vraiment.

Sundar Pichai

Cela nous aide à fournir des recommandations (referrals) de meilleure qualité où les gens ont une probabilité beaucoup plus élevée de trouver ce qu'ils cherchent, ils explorent et sont curieux. Leur intention est davantage satisfaite. C'est ce que montrent tous nos indicateurs.

Lex Fridman

Cela rend nerveux les humains qui créent le Web. Les journalistes commencent à être nerveux. CNN est nerveux à cause des podcasts. Cela rend les gens nerveux.

Sundar Pichai

Je pense que l'actualité et le journalisme joueront un rôle important à l'avenir. Nous y sommes très attachés et nous veillons à ce que cet écosystème s'épanouisse. Je pense que nous serons capables de nous différencier en tant qu'entreprise au fil du temps grâce à notre engagement là-bas. C'est quelque chose que j'apprécie beaucoup et pendant que nous concevons, nous continuerons à prioriser les approches.

Lex Fridman

Je suis sûr que pour les gens qui le souhaitent, ils peuvent avoir un modèle d'IA affiné qui sera composé d'articles putaclics (clickbait) de dénigrement qui remplaceront le journalisme actuel. Pardonnez-moi. Mais je trouve que si vous cherchez une critique vraiment solide des choses, Gemini est très doué pour fournir cela. C'est mieux que n'importe quoi pour l'instant. Les gens craignent qu'il y ait un biais introduit car à mesure que les systèmes d'IA deviennent de plus en plus puissants, il y a une incitation de la part des sponsors à essayer de contrôler la sortie. Mais pour l'instant, la critique objective fournie est bien meilleure que le journalisme. Bien sûr, l'argument est que les journalistes sont toujours précieux. Mais le journalisme participatif (crowdsourced) que nous obtenons sur l'Internet ouvert est également très puissant.

Lex Fridman

Très puissant.

Sundar Pichai

J'ai l'impression que ce sont toutes des choses super importantes. C'est bien d'avoir beaucoup d'informations participatives qui arrivent.

Sundar Pichai

Mais je pense qu'il y a une réelle valeur pour le journalisme de haute qualité et que tout cela est complémentaire. Je me retrouve constamment à rechercher des reportages objectifs sur les choses également. Parfois, on obtient plus de contexte grâce aux sources participatives qu'on lit en ligne, mais je pense que les deux finissent par jouer un rôle super important.

Lex Fridman

Demis a parlé de la tranche du Web qui servira de plus en plus à fournir des informations aux agents. On peut y voir comme deux couches du Web : une pour les humains, une pour les agents. Voyez-vous celle qui est destinée aux agents d'IA croître au fil du temps ? Voyez-vous toujours de la valeur pour le Web créé par des humains pour des humains, ou n'y aura-t-il plus que des agents à la fin ?

Sundar Pichai

Aujourd'hui, on va dans un grand magasin de détail et on aime parcourir les rayons ou choisir de la nourriture dans une épicerie. Mais on fait aussi des achats en ligne et ils livrent. Les deux sont complémentaires et c'est vrai aussi pour les restaurants. Je pense qu'avec le temps, les sites Web s'amélioreront également pour les humains et seront mieux conçus. L'IA pourrait en fait mieux les concevoir pour les humains. Je m'attends à ce que le Web devienne beaucoup plus riche et plus agréable à utiliser. En même temps, je pense qu'il y aura un Web de type agent qui fait également beaucoup de progrès et il faut résoudre la valeur commerciale et les incitations pour que cela fonctionne bien afin que les gens y participent. Les deux coexisteront et évidemment les agents n'auront pas besoin du même paradigme de conception et d'interface utilisateur dont les humains ont besoin pour interagir. Les deux seront là.

Google Chrome and Moonshots

Lex Fridman

Je dois vous poser une question sur Chrome. Pour moi personnellement, Google Chrome figure parmi les meilleurs logiciels de tous les temps. Le navigateur est notre fenêtre sur le Web et Chrome a vraiment continué à pousser l'innovation sur ce front quand c'était stagnant et il continue de le rendre plus performant et efficace. Vous étiez l'un des pionniers de Chrome poussant pour cela quand c'était une idée folle. Quelle était votre vision ?

Sundar Pichai

C'était une époque dynamique vers 2004 ou 2005 avec AJAX et le Web qui devenait soudainement dynamique. Flickr, Gmail, Google Maps ont tous vu le jour. Le fait que l'on ait un Web interactif dynamique et que le Web évoluait du simple HTML vers des applications dynamiques riches signifiait que le navigateur n'avait jamais été conçu pour ce monde. L'exécution du JavaScript était super lente et le navigateur était loin d'être un système d'exploitation pour ce Web moderne riche qui se mettait en place. C'est l'opportunité que nous avons vue. C'est une équipe de début incroyable. Je me souviens encore du jour où nous avons fait fonctionner un shell sur WebKit et à quel point c'était rapide. Nous avions la vision claire de construire un navigateur parce que nous voulions apporter les principes fondamentaux du système d'exploitation dans le navigateur. Nous avons construit un navigateur sécurisé, isolé (sandboxed), où chaque onglet était son propre processus. Ces choses sont courantes maintenant, mais à l'époque c'était assez unique. Nous avons trouvé une équipe incroyable à Aarhus, au Danemark, avec un leader qui a construit V8, la machine virtuelle JavaScript, qui à l'époque était 25 fois plus rapide que n'importe quelle autre machine virtuelle JavaScript. Nous avons tout mis en open source et l'avons placé dans Chromium. Nous pensions vraiment que le Web pourrait fonctionner bien mieux et qu'on pourrait naviguer sur le Web de manière beaucoup plus sûre. Le nom Chrome est venu parce que nous sentions littéralement que le « chrome » (l'interface) du navigateur devenait de plus en plus encombrant. Nous voulions le minimiser. C'est ce que j'ai eu de plus amusant à faire : construire un produit à partir de zéro et c'était une équipe extraordinaire.

Lex Fridman

Pour les gens qui ne le savent pas, c'est grâce à vous que nous avons Chrome. Vous avez poussé pour cela au sein d'une entreprise qui s'y opposait probablement parce que c'est une idée folle et qu'il est incroyablement difficile de construire un navigateur.

Sundar Pichai

Eric, qui était le PDG à l'époque, n'était pas tant opposé mais il savait de première main à quel point c'est une chose folle que d'aller construire un navigateur. Il a été très solidaire, tout comme les fondateurs. Une fois que nous avons commencé à construire quelque chose et que nous avons pu l'utiliser et voir à quel point c'était mieux, cela a pris vie assez rapidement.

Lex Fridman

Quelle sagesse tirez-vous du fait d'avoir persévéré sur une idée folle à ses débuts et qui finit par être révolutionnaire ? Qu'en est-il des futures idées folles du même genre ?

Sundar Pichai

C'est quelque chose que Larry et Sergey ont clairement articulé. J'ai vraiment intériorisé cela dès le début : leur sentiment à propos du travail sur les moonshots comme un moyen lorsqu'on travaille sur quelque chose de très ambitieux. Premièrement, cela attire les meilleures personnes. Deuxièmement, parce que c'est si ambitieux, vous n'avez pas d'autres personnes travaillant sur quelque chose de fou, donc vous avez pratiquement la voie libre pour vous seul. Troisièmement, même si on finit par ne pas accomplir ce qu'on s'est fixé de faire et qu'on finit par en faire 60 % ou 80 %, cela finira par être un succès phénoménal. C'est le conseil que je donnerais aux gens. Viser de grandes idées présente tous ces avantages. C'est risqué, mais cela présente des avantages que les gens n'intériorisent pas pleinement.

Waymo and Robotics

Lex Fridman

Vous avez mentionné l'un des moonshots les plus fous qu'est Waymo. Quand j'ai vu pour la première fois il y a plus d'une décennie une voiture autonome de Google, ce fut une révélation pour la robotique. Je suis vraiment reconnaissant pour ce projet pour ce qu'il symbolise. Mais c'est aussi un moonshot fou. Waymo a calmement amélioré le système de mieux en mieux. Félicitations pour les 10 millions de trajets en robotaxi payés. Quelles leçons tirez-vous de Waymo concernant la persévérance et la persistance sur ce projet ?

Sundar Pichai

Vraiment fier des progrès que nous avons accomplis avec Waymo. L'une des choses pour lesquelles nous étions très engagés est que les derniers 20 % prennent 80 % du temps. Nous traversions cette phase avec Waymo. Nous savions que nous en étions à ce stade et que l'écart technologique était là. En fait, c'est juste au moment où les autres doutaient de Waymo que j'ai pris la décision d'investir davantage dans Waymo. Nous avons toujours été une entreprise de technologie profonde et Waymo est une version de la construction d'un robot d'IA qui fonctionne bien. Nous sommes attirés par des problèmes comme celui-là. Il était très évident que nous allions y arriver. Nous avons toujours priorisé l'ambition et la sécurité en même temps et étions également engagés dans les deux. Je ne pourrais pas être plus ravi de la façon dont cela fonctionne et de l'amour des gens pour l'expérience. Cette année, nous avons beaucoup passé à l'échelle et nous continuerons à monter en puissance en 26.

Lex Fridman

Cela dit, la concurrence s'intensifie. Vous avez été amical avec Elon même si techniquement c'est un concurrent. Que pensez-vous des efforts en matière de robotaxis que déploie Tesla ? Est-ce que vous y voyez une concurrence ?

Sundar Pichai

Nous sommes l'un des premiers et des plus gros soutiens de SpaceX en tant que Google. Je suis ravi de ce que fait SpaceX et j'ai la chance d'être investisseur via l'entreprise là-bas. Nous ne sommes pas en concurrence directe avec Tesla car nous ne fabriquons pas de voitures. Nous construisons une autonomie de niveau L4 et L5. Nous construisons un conducteur Waymo qui est polyvalent et peut être utilisé dans de nombreux contextes. Ils travaillent évidemment à rendre la conduite autonome de Tesla également performante. J'ai simplement supposé que c'est un fait acquis qu'Elon réussirait dans tout ce qu'il entreprend. Mais ces espaces sont des espaces tellement vastes. Pensez au transport. Le conducteur Waymo est une technologie polyvalente que nous pouvons appliquer dans de nombreuses situations. Dans tous les scénarios futurs, je vois Tesla réussir et Waymo réussir.

Lex Fridman

Dans l'ensemble de l'IA (AI package), quand l'histoire sera écrite, les véhicules autonomes et les voitures sans conducteur pourraient être la grande chose qui changera tout. Cela pourrait changer complètement notre façon de nous déplacer dans le monde. On verra avec Alphabet et Waymo et les trucs de robotique Gemini qui pourraient vous mener dans d'autres domaines de la robotique. Waymo est un robot qui se trouve sur quatre roues. Vous avez dit que la prochaine grande chose que nous pouvons aussi inclure dans l'ensemble de l'IA pourrait être dans le domaine de la robotique. À quoi pensez-vous que cela ressemblerait ?

Sundar Pichai

Demis et l'équipe de Google DeepMind sont très concentrés sur la robotique Gemini. Nous construisons manifestement bien les modèles sous-jacents et sommes à la pointe de notre recherche là-bas. Nous réfléchissons à des applications en robotique et y travaillerons sérieusement. Nous sommes partenaires de quelques entreprises aujourd'hui, mais c'est un domaine où je dirais restez à l'écoute. Nous n'avons pas encore pleinement articulé nos plans à l'extérieur, mais c'est un domaine où nous sommes déterminés à stimuler beaucoup de progrès. Je pense que l'IA finit par stimuler ce progrès massif en robotique. Le domaine a été freiné pendant un certain temps. Le matériel a fait des progrès extraordinaires mais le logiciel était le défi. Avec l'IA maintenant et les modèles généralisés que nous construisons, les faire fonctionner dans le monde réel de manière sûre et généralisée est la frontière que nous poussons assez fort.

Lex Fridman

C'est vraiment agréable de voir les modèles et les différentes équipes intégrés vers un modèle mondial unique en cours de construction. La même chose qui rendrait le mode IA vraiment efficace pour répondre à vos questions est le même genre de chose qui aiderait un robot à être utile dans le monde physique. Tout est aligné.

Sundar Pichai

C'est ce qui rend ce moment si unique. En dirigeant une entreprise pour la première fois, on peut faire un investissement horizontal profond et par-dessus stimuler plusieurs activités. C'est effectivement ce que nous faisons chez Google et Alphabet.

AI in Productivity: Gmail and Coding

Lex Fridman

Gmail et Sheets et tous ces autres services comme Gmail ont révolutionné le courrier électronique. Mais dès qu'on commence à intégrer l'IA Gemini dans Gmail, tout change. Les gens se plaignent des e-mails mais cela a tout changé. Il y a eu quelques personnes essayant de révolutionner l'e-mail et c'est mûr pour l'innovation. Vous avez fait une démonstration d'une très belle réponse personnalisée. Au début, je me sentais vraiment mal à ce sujet, mais j'ai ensuite réalisé qu'il n'y avait rien de mal parce que l'exemple que vous avez donné est celui d'un ami qui demande conseil sur un lieu de randonnée et cela cherche dans toutes vos informations pour lui donner de bons conseils, puis vous y mettez votre touche personnelle. L'aspect informationnel et le transfert de connaissances que cela fait pour vous est génial.

Sundar Pichai

Si on écrit une carte de sa propre main et qu'on l'envoie à quelqu'un, c'est quelque chose de spécial. De même, il y aura peut-être un moment où un ami écrira pour dire qu'il ne va pas bien. Ce sont des moments pour lesquels on veut garder du temps pour écrire et tendre la main. Mais dire « donne-moi tous les détails du voyage que nous avons fait » a beaucoup de sens pour qu'un assistant d'IA vous aide. Cette direction m'enthousiasme.

Lex Fridman

En fin de compte, cela nous donne plus de temps, à nous humains, pour faire les choses que nous trouvons significatives. Cela effraie beaucoup de gens parce que nous allons devoir nous poser la question difficile de ce que nous trouvons significatif. Cela pourrait être l'éducation des enfants ou être créatif dans certains domaines de l'art ou de l'écriture et cela nous pousse à nous demander ce qui dans notre vie apporte le plus de joie et d'épanouissement. Si on est capable de consacrer plus de temps à cela, c'est vraiment puissant.

Sundar Pichai

C'est le Saint Graal. Si nous réussissons cela, cela permettra à plus de gens de trouver cela.

Lex Fridman

L'IA devient vraiment douée pour la programmation. Gemini a été incroyable. Beaucoup de programmeurs craignent vraiment de perdre leur emploi. À quel point devraient-ils être inquiets et comment devraient-ils s'adapter pour pouvoir prospérer dans ce nouveau monde où de plus en plus de code est écrit par l'IA ?

Sundar Pichai

Nous avons donné diverses statistiques montrant qu'environ 30 % du code utilise désormais des suggestions générées par l'IA. L'indicateur le plus important que nous mesurons avec soin est l'augmentation de notre vélocité d'ingénierie en tant qu'entreprise grâce à l'IA. Nos estimations sont que ce chiffre est maintenant de 10 %. À travers l'entreprise, nous avons accompli une augmentation de 10 % de la vélocité d'ingénierie en utilisant l'IA. Mais nous prévoyons d'embaucher plus d'ingénieurs l'année prochaine parce que l'espace d'opportunités de ce que nous pouvons faire s'élargit aussi. Espérons qu'à court ou moyen terme, pour de nombreux ingénieurs, cela libère plus de temps pour la conception, l'architecture et la résolution de problèmes qui sont amusants. Il y a beaucoup de travail ingrat qui va de pair et cela enlève, on l'espère, une grande partie de cela et rend le codage encore plus amusant et vous libère plus de temps pour créer et faire du brainstorming. Deuxièmement, cela mettra le pouvoir créatif entre les mains de plus de gens, ce qui signifie que les gens créeront plus et il y aura plus d'ingénieurs faisant plus de choses. C'est difficile à prédire pleinement, mais je pense qu'en général dans ce moment les gens adoptent ces outils et sont de meilleurs programmeurs. Il y a plus de gens qui jouent aux échecs maintenant que jamais auparavant. Cela semble positif de cette façon pour moi, du moins en parlant dans un contexte Google.

Lex Fridman

Je sais juste par expérience que beaucoup de bons programmeurs génèrent beaucoup de code. Leur productivité augmente. Même pour moi, avec la programmation comme activité secondaire, je pense être 5 fois plus productif. J'imagine que très bientôt cette productivité devrait augmenter encore plus.

Sundar Pichai

Le grand déblocage se produira à mesure que nous rendrons les capacités agentiques beaucoup plus robustes. Ces 10 % sont un chiffre massif. Si demain j'arrivais et disais que vous pouvez améliorer la productivité d'une grande organisation de 10 % quand vous avez des dizaines de milliers d'ingénieurs, c'est un chiffre phénoménal. C'est différent de ce que d'autres citent comme statistiques disant que tel pourcentage de code est maintenant écrit par l'IA. Je parle davantage de la productivité globale réelle de l'ingénierie, qui est l'indicateur le plus important. Cela va s'améliorer. Il n'y a aucun ingénieur qui demain, s'il devenait magiquement 2 fois plus productif, ne créerait pas plus de choses et ne créerait pas plus de valeur. Je pense qu'on trouvera plus de satisfaction dans son travail.

Lex Fridman

La base de code réelle de Google pourrait s'améliorer simplement parce qu'elle deviendra plus standardisée et facile à parcourir pour les gens car l'IA y aidera. Par conséquent, cela permettra également à l'IA de mieux comprendre l'ensemble de la base de code. J'utilise beaucoup Cursor comme moyen de programmer avec Gemini et d'autres modèles. L'un de ses points forts est qu'il a conscience de l'ensemble de la base de code et cela permet aux agents de se déplacer dans cette base de code de manière vraiment puissante. C'est un déblocage énorme.

Sundar Pichai

Pensez aux migrations et à la refactorisation d'anciennes bases de code une fois que nous pourrons faire tout cela de manière bien meilleure et plus robuste qu'aujourd'hui.

Lex Fridman

Je pense qu'à la fin tout sera écrit en JavaScript et s'exécutera dans Chrome. Google a des entretiens de codage légendaires pour les ingénieurs. Comment cela a-t-il changé à l'ère de l'IA ?

Sundar Pichai

Bonne question. Nous nous assurons d'introduire au moins un tour d'entretiens en personne pour les gens juste pour s'assurer que les bases sont là. Je pense qu'elles finiront par être importantes. Mais c'est une compétence tout aussi importante. Si on peut utiliser ces outils pour générer un meilleur code, je pense que c'est un atout. Dans l'ensemble, je pense que c'est un point positif massif.

Lex Fridman

Ingénieur de codage au feeling (vibe coding). Recommandez-vous aux étudiants intéressés par la programmation de suivre encore une formation en informatique ?

Sundar Pichai

Je le recommande. Si vous avez une passion pour l'informatique, je le ferais. L'informatique est évidemment bien plus que la programmation seule. Je ne pense toujours pas que je changerais ce qu'on poursuit. L'IA permettra horizontalement d'avoir un impact dans tous les domaines. Il est assez difficile de prédire de quelles manières. Donc toute éducation dans laquelle on apprend une bonne réflexion sur les principes fondamentaux est une bonne éducation.

Android XR and Future Interfaces

Lex Fridman

Android a changé la donne. À quoi ressemble l'avenir d'Android ? Est-il possible qu'il devienne de plus en plus centré sur l'IA, surtout maintenant que vous y ajoutez Android XR capable de faire de la réalité augmentée et mixte dans le monde physique ?

Sundar Pichai

Les meilleures innovations en informatique sont venues d'un changement de paradigme d'entrées/sorties (I/O), comme avec l'interface graphique (GUI) ou le multi-touch dans le contexte du mobile et de la voix plus tard. De même, j'ai l'impression que la RA (réalité augmentée) est ce prochain paradigme. Elle a été freinée par les défis d'intégration du système pour faire une bonne RA et le fait qu'on a besoin d'IA pour rendre les I/O fluides. C'est pourquoi le projet Astra finit par être super critique pour ce monde Android XR. Je pense que quand on utilise des lunettes, elles vont être très utiles. C'est une réelle opportunité pour Android et la XR est une façon dont cela prendra vraiment vie. Mais je pense qu'il y a une opportunité de repenser aussi l'OS mobile. Nous avons vécu dans ce paradigme d'applications et de raccourcis. Tout cela ne disparaîtra pas. Mais si on essaie de faire avancer les choses au niveau d'un système d'exploitation, il doit être plus de type agent pour comprendre de manière proactive ce qu'on essaie de faire et s'adapter à nous. C'est le déblocage que nous devons aller faire.

Lex Fridman

J'ai eu l'occasion d'essayer les lunettes et elles sont incroyables. Pas de latence et ça marche, tout simplement. Même cette petite démo de carte où l'on regarde en bas et en haut et il y a une transition fluide. Assez d'informations sont affichées pour ne pas distraire du monde extérieur. Afin de faire de cela une réalité, vous devez résoudre beaucoup de problèmes d'OS pour vous assurer que cela fonctionne quand vous intégrez l'IA. C'est un bon moonshot.

Sundar Pichai

C'est beaucoup plus proche de la réalité que d'autres moonshots. Nous prévoyons d'avoir des lunettes entre les mains des développeurs plus tard cette année et entre les mains des consommateurs l'année prochaine. C'est une période passionnante.

Google Beam and Android XR Demos

Andrew

Salut Lex, je m'appelle Andrew. Je dirige l'équipe Google Beam et nous allons vous montrer un aperçu de quelque chose de nouveau. Une façon de se connecter et de se sentir présent de n'importe où avec n'importe qui à qui on tient. Voici Google Beam. C'est une plateforme de développement que nous avons construite. Il y a un prototype ici et un juste au bout du couloir. Je vais y aller et l'allumer dans une seconde. Nous allons vivre l'expérience ensemble.

Lex Fridman

Whoa, d'accord.

Max

Lex, nous y voilà.

Lex Fridman

D'accord. C'est déjà réel. Wow.

Max

C'est réel. Ravi de vous voir. Voici Google Beam. Nous essayons de donner l'impression que vous et moi pourrions être n'importe où dans le monde, mais quand ces fenêtres magiques s'ouvrent, nous sommes de nouveau ensemble. Je vous vois exactement de la même manière que vous me voyez. C'est presque comme si nous étions assis à table en train de partager un repas ensemble.

Lex Fridman

On peut donc sentir la profondeur de sa main.

Max

Oui, ravi de vous rencontrer.

Lex Fridman

Donc pour les gens qui ne peuvent probablement même pas imaginer à quoi cela ressemble, il y en a une version 3D. Vous avez l'air réel.

Max

Oui, cela me semble réel et cela vous semble réel.

Lex Fridman

On dirait que vous sortez de l'écran.

Max

On finit par croire rapidement que nous sommes tout simplement ensemble. On s'y installe naturellement depuis n'importe où dans le monde avec ces écrans magiques.

Lex Fridman

C'est incroyable. J'ai vu des démos de ça, mais elles sont loin d'égaler l'expérience. On a l'impression que la caméra a été éteinte et que nous sommes juste dans la même pièce ensemble. C'est vraiment convaincant.

Max

C'est vrai. Je sais qu'il est un peu tard aussi, alors je vous ai apporté un en-cas au cas où vous auriez un petit creux. Mais...

Lex Fridman

Alors quoi, on peut le pousser plus loin et ça devient juste... wow.

Max

Oui, essayons de le faire flotter entre les pièces. Cela le fait passer progressivement de ma pièce à la vôtre.

Lex Fridman

Et puis vous voyez ma main, la profondeur de ma main. Bien sûr.

Max

Essayez ceci, essayez de me faire un « check » (high five) et il y a presque une sensation de contact. On peut presque le sentir parce qu'on y est tellement attentif. C'est une expérience magique.

Lex Fridman

Oh, c'est vraiment bien. Combien ça coûte ?

Max

Nous avons beaucoup d'entreprises qui le testent. Nous venons d'annoncer que nous allons bientôt l'introduire dans les bureaux sous forme d'une série de produits. Finalement, je pense que ce sera dans presque tous les écrans.

Lex Fridman

Il n'y a rien, je ne porte rien d'autre que des vêtements. Ce n'est pas de l'image de synthèse (CGI). Le son est vraiment bon et vous me voyez de la même manière tridimensionnelle.

Max

Oui. Le son est spatialisé, donc si je parle d'ici, on a l'impression que je parle d'ici. Ces petits indices subtils comptent vraiment pour rapprocher les gens. Tous les signaux non verbaux et l'émotion sont réinjectés dans le système et cela semble réel.

Lex Fridman

Vous avez réussi. Bordel de merde, ils ont réussi. Et j'ai vu la traduction intégrée là-dedans aussi. C'est ça ?

Max

Oui, nous avons un tas de trucs. Faisons un peu de travail ensemble. Peut-être que nous pourrions critiquer l'un de vos derniers travaux. Nous sommes donc dans la même pièce, mais avec ce super-pouvoir, je peux amener d'autres choses ici avec moi. C'est agréable que nous puissions nous asseoir ensemble, regarder quelque chose ou travailler. Nous avons partagé des repas en équipe dans ce système, mais une fois que vous avez l'aspect de présence, vous voulez y apporter d'autres super-pouvoirs.

Lex Fridman

Et ainsi vous pourriez réviser du code ensemble.

Max

Oui, exactement. J'ai des diapositives sur lesquelles je travaille, peut-être que vous pourriez m'aider avec ça. Gardez les yeux sur moi une seconde. Je vais me reglisser au centre. Je n'ai pas vraiment bougé, mais le système nous place juste au bon endroit. Il sait où nous devons être.

Lex Fridman

Oh, donc vous vous tournez juste vers votre ordinateur portable, le système vous déplace et fait ensuite l'incrustation automatiquement.

Max

Il transforme en quelque sorte la pièce pour placer les choses à l'endroit où elles doivent être. Chaque chose a sa place dans la pièce et cela nous donne l'impression d'être ensemble avec nous et d'autres objets.

Lex Fridman

Je devrais aussi dire que vous n'êtes pas seulement en trois dimensions, on a l'impression que vous vous penchez hors de l'écran. Vous sortez de l'écran. Bordel. Revenez au centre.

Max

Laissez-moi vous montrer comment cela fonctionne. Il y a deux choses difficiles que nous avons assemblées. L'une est un modèle vidéo IA. Il y a un ensemble de six caméras couleur qui prennent des flux vidéo et les injectent dans notre modèle IA et transforment cela en une vidéo 3D de vous et moi. C'est effectivement un champ de lumière, une vidéo 3D interactive qu'on peut voir sous n'importe quel angle. C'est transmis à la deuxième chose, un écran à champ de lumière. Je vous vois et vous me voyez tous les deux dans nos écrans à champ de lumière. Ce sont effectivement des écrans plats, mais ils ont le sens de la dimensionnalité, de la profondeur et la taille est correcte. On peut voir que les ombres et l'éclairage sont corrects. Tout est correct de votre point de vue. Si vous bougez, vous voyez une perspective différente de moi. Les choses qui étaient masquées sont révélées. Tout cela est calculé et généré en fonction de la position de vos yeux pour que vous vous sentiez simplement présent.

Lex Fridman

C'est en temps réel, sans latence. Je n'ai vu aucun gel d'image du tout.

Max

Non, j'espère bien. C'est vous et moi ensemble en temps réel et c'est ce dont on a besoin pour une véritable communication à un niveau de qualité réaliste.

Lex Fridman

C'est génial. Est-il possible de le faire à trois personnes ?

Max

Si elle entre dans la pièce avec nous, vous pouvez la voir et vous pouvez me voir. Si nous avions plus de monde, on finirait par perdre le sentiment de présence. On réduit la taille des gens et on perd le sens de l'échelle. La fenêtre convient à un certain nombre de personnes. Si on veut faire tenir un grand groupe de personnes, il faut une fenêtre beaucoup plus large. Si on veut voir grand-mère et les enfants, on peut utiliser des fenêtres plus petites. Tout le monde a sa place à table. Si on a trop de monde, on revient aux métaphores 2D auxquelles nous sommes habitués, les gens dans des tuiles.

Lex Fridman

Pour l'image que je vois, avez-vous dû vous faire scanner ?

Max

Je vous vois sans avoir été scanné. C'est tellement plus simple si on n'a rien à porter ou à pré-scanner. On le fait juste comme c'est censé se passer, sans que personne n'ait rien à apprendre ou à enfiler.

Lex Fridman

Je pensais que vous deviez résoudre le problème du scan, mais ici ce ne sont que des caméras.

Max

C'est de la vidéo. Nous n'essayons pas de faire une approximation de vous parce que tout ce que vous faites chaque jour compte. Vous apparaissez tel que vous êtes et tout cela est transmis fidèlement au fur et à mesure que cela se produit.

Lex Fridman

Lex, ravi de vous rencontrer. Nous avons des lunettes ici. Nous commençons avec la base de superbes lunettes, quelque chose d'élégant et de léger. Ensuite nous nous demandons comment construire une technologie de pointe par-dessus. L'un des principes fondamentaux est cette idée d'un appareil conversationnel multimodal qui peut voir ce que vous voyez et entendre ce que vous entendez. On a une caméra, des haut-parleurs et plusieurs microphones pour l'isolation du locuteur. Je vais vous donner la chance de les essayer vous-même.

Lex Fridman

Whoa.

Inconnu

La première chose que vous voyez est un simple écran d'accueil avec l'heure, la météo et le calendrier. C'est conçu pour être votre guichet unique pour des informations rapides et consultables d'un coup d'œil. Nous voulons qu'il soit facile d'obtenir ce dont on a besoin et de retourner ensuite à ce qu'on faisait. On peut être totalement conversationnel. On peut poser des questions sur les peintures et poser des questions de suivi. Si on veut faire une pause, on tape simplement sur le côté droit.

Lex Fridman

Gemini, combien coûte ce tableau ?

Gemini

Le tableau s'intitule Le pont de Le Petit-Bicêtre, 1875, par Armand Guillaumin. Il semble s'agir d'une reproduction, et il serait impossible d'en connaître le prix sans trouver le vendeur.

Lex Fridman

D'accord, c'est donc un faux. Je comprends. Pourquoi les humains paient-ils autant d'argent pour des tableaux ?

Gemini

Les gens paient cher pour des peintures en raison de leur mérite artistique, de la célébrité de l'artiste, de leur rareté et pour l'appréciation de l'art.

Inconnu

Allez-y et faites un appui long sur le côté pour mettre Gemini en veille. Avez-vous suivi Google I/O la semaine dernière ? Vous avez peut-être vu sur scène l'expérience Google Maps. On peut imaginer qu'on marche dans la rue et si on lève les yeux, on obtient des directions rapides virage après virage. On a une idée du prochain virage tout en gardant son téléphone dans sa poche.

Lex Fridman

C'est tellement intuitif. Parfois on a besoin de savoir rapidement quel est le bon chemin.

Inconnu

Parfois il suffit de jeter un coup d'œil à ses pieds. Nous l'avons configuré pour traduire du russe vers l'anglais. Je crois que c'est moi qui porte les lunettes et vous me parlez.

Lex Fridman

D'accord, je peux parler russe. Привет, друг. Как у тебя дела ?

Inconnu

Je vais bien. Comment allez-vous ?

Lex Fridman

А ты сразу мой голос слышишь или подождать надо ?

Inconnu

Je vois la transcription en temps réel. Selon les différentes langues il y a un léger délai, mais c'est vraiment comme des sous-titres pour le monde réel. Merci pour ça.