NVIDIA CES 2025 : L'ère de l'IA physique et de l'architecture Blackwell
7 janvier 2025
Technologie & Intelligence Artificielle
Introduction : La puissance des jetons
C'est ainsi que l'intelligence est fabriquée.
Un nouveau type d'usine.
Générateur de jetons.
Les briques élémentaires de l'IA.
Les jetons ont ouvert une nouvelle frontière.
Le premier pas dans un monde extraordinaire, où naissent des possibilités infinies.
Les jetons transforment les mots en connaissances et donnent vie aux images.
Ils transforment les idées en vidéos et nous aident à naviguer en toute sécurité dans n'importe quel environnement.
Les jetons apprennent aux robots à bouger comme les maîtres.
Inspirer de nouvelles façons de célébrer nos victoires.
Un martini, s'il vous plaît.
Arrive tout de suite.
Merci, Adam.
Et nous apporter la tranquillité d'esprit quand nous en avons le plus besoin.
Salut, Mocca.
Salut, Anna. C'est bon de te revoir.
Salut, Emma. Nous allons faire une prise de sang aujourd'hui, d'accord ?
Ne t'inquiète pas. Je vais être là tout le temps.
Ils donnent du sens aux chiffres pour nous aider à mieux comprendre le monde qui nous entoure.
Prédire les dangers qui nous entourent.
Et trouver des remèdes aux menaces qui nous habitent.
Les jetons peuvent donner vie à nos visions.
Et restaurer ce que nous avons perdu.
Zachary, j'ai retrouvé ma voix, mon pote.
Ils nous aident à avancer, un petit pas à la fois.
Et un pas de géant ensemble.
Et c'est ici que tout commence.
Accueillons sur scène le fondateur et PDG de NVIDIA, Jensen Huang.
Ouverture du CES et Histoire de NVIDIA
Bienvenue au CES !
Êtes-vous ravis d'être à Las Vegas ?
Est-ce que vous aimez ma veste ?
J'ai pensé faire le contraire de Gary Shapiro.
Je suis à Las Vegas, après tout. Si ça ne marche pas, ou si vous vous y opposez, habituez-vous-y tout simplement. Je pense vraiment que vous devez laisser cela faire son chemin. Dans une heure environ, vous vous sentirez bien.
Bienvenue chez NVIDIA. Vous êtes à l'intérieur du jumeau numérique de NVIDIA. Nous allons vous emmener chez NVIDIA. Mesdames et messieurs, bienvenue chez NVIDIA.
Vous êtes à l'intérieur de notre jumeau numérique.
Tout ici est généré par l'IA.
Ce fut un voyage extraordinaire, une année extraordinaire. Et cela a commencé en 1993.
Prêt ? Partez !
Avec le NV1, nous voulions construire des ordinateurs capables de faire des choses que les ordinateurs normaux ne pouvaient pas faire. Le NV1 a permis d'avoir une console de jeu dans votre PC. Notre architecture de programmation s'appelait Unified Device Architecture, ou UDA. Le premier développeur et la première application pour l'UDA fut Virtua Fighter de Sega.
Six ans plus tard, en 1999, nous avons inventé le GPU programmable. Cela a marqué le début de plus de 20 ans d'avancées incroyables pour ce processeur, rendant possible l'informatique graphique moderne.
Aujourd'hui, 30 ans plus tard, le Virtua Fighter de Sega est complètement cinématographique. Voici le nouveau projet Virtua Fighter qui arrive. J'ai hâte. C'est absolument incroyable.
En 2005, nous avons inventé CUDA afin de pouvoir exprimer la programmabilité de nos GPU vers un vaste ensemble d'algorithmes. CUDA a initialement pris des années à être expliqué. Vers 2012, Alex Krizhevsky, Ilya Sutskever et Geoff Hinton l'ont utilisé pour traiter AlexNet, et le reste appartient à l'histoire. L'IA a progressé à un rythme incroyable depuis, en commençant par l'IA de perception jusqu'à l'IA générative, et maintenant l'IA agentique capable de percevoir, raisonner, planifier et agir. La prochaine phase est l'IA physique.
L'évolution de l'informatique et des Transformers
En 2018, le Transformer de Google a été lancé sous le nom de BERT, et le monde de l'IA a vraiment décollé. Les Transformers ont complètement changé le paysage de l'informatique dans son ensemble. Nous avons reconnu que l'apprentissage automatique permis par les Transformers allait fondamentalement changer le fonctionnement de l'informatique. Aujourd'hui, l'informatique est révolutionnée à chaque niveau. Du codage manuel des instructions sur les CPU, nous disposons désormais de l'apprentissage automatique qui crée et optimise des réseaux neuronaux traitant sur des GPU. C'est une transformation incroyable en seulement 12 ans.
Nous pouvons désormais comprendre des informations de presque n'importe quelle modalité, y compris les acides aminés et la physique. Nous pouvons les traduire et les générer. Les applications sont infinies. Presque toute application d'IA peut être comprise en se demandant de quelle modalité l'entrée a appris, vers quoi elle a été traduite et ce qu'elle génère. L'apprentissage automatique a changé la façon dont chaque application est construite et les possibilités au-delà.
À bien des égards, l'IA est la maison que GeForce a construite. GeForce a permis à l'IA d'atteindre les masses, et maintenant l'IA revient chez GeForce. Laissez-moi vous montrer certaines des choses que vous ne pouvez pas faire sans l'IA.
GeForce RTX 50 Series et Architecture Blackwell
C'était de l'informatique graphique en temps réel.
Aucun chercheur en informatique graphique ne vous aurait dit qu'il est possible de faire du ray tracing sur chaque pixel à ce stade. Le ray tracing est une simulation de la lumière, et la quantité de géométrie que vous avez vue aurait été impossible sans l'IA. Nous avons utilisé l'ombrage programmable et l'accélération du ray tracing pour produire des pixels, puis nous avons utilisé l'IA conditionnée par ces pixels pour en générer davantage. Le DLSS peut déduire et prédire les pixels que nous n'avons pas rendus, et même générer des images supplémentaires. Nous ne calculons que deux millions de pixels et l'IA prédit les 33 millions restants. Cela permet des performances incroyablement élevées car l'IA est extrêmement efficace. GeForce a permis l'IA, et maintenant l'IA révolutionne GeForce. Aujourd'hui, nous annonçons notre prochaine génération, la famille RTX Blackwell.
Voici notre toute nouvelle série GeForce RTX 50, architecture Blackwell. Le GPU possède 92 milliards de transistors, 4 000 TOPS et quatre pétaflops d'IA, ce qui est trois fois plus élevé que la génération précédente. Nous avons également 380 téraflops de ray tracing et 125 téraflops de shader. Avec la mémoire G7 de Micron, nous avons 1,8 téraoctet par seconde. Nous pouvons désormais entremêler les charges de travail de l'IA et de l'informatique graphique. Le shader programmable peut désormais traiter des réseaux neuronaux, permettant la compression de textures neuronales et l'ombrage des matériaux. Voici la toute nouvelle RTX Blackwell 5090.
Même la conception mécanique est un miracle. Elle possède deux ventilateurs, et la carte graphique entière est essentiellement un ventilateur géant. La conception du régulateur de tension est à la pointe de la technologie. L'équipe d'ingénierie a fait un excellent travail.
La RTX 4090 coûte 1 599 $ et constitue l'un des meilleurs investissements pour votre centre de divertissement PC. Maintenant, pour 1 599 $, vous pouvez passer à la version supérieure. Avec la famille Blackwell, la RTX 5070 offre les performances de la 4090 pour 549 $.
C'est impossible sans l'IA et les mémoires G7. Voici toute la famille, de la 5070 à la 5090. La 5090 offre deux fois les performances d'une 4090. La disponibilité commence en janvier.
Nous avons réussi à intégrer ces GPU haute performance dans un ordinateur portable. Cet ordinateur portable 5070 à 1 299 $ a les performances d'une 4090. Laissez-moi vous montrer. Mesdames et messieurs, Janine Paul.
Nous réduisons Blackwell pour l'intégrer ici. On ne peut pas faire ça sans l'IA. Comme nous générons la plupart des pixels à l'aide de cœurs Tensor, l'efficacité énergétique est hors du commun. L'avenir de l'informatique graphique est le rendu neuronal. La 5090 tiendra dans un ordinateur portable fin de 14,9 millimètres. Voici la famille RTX Blackwell.
L'infrastructure de l'IA et les lois de mise à l'échelle
GeForce a démocratisé l'IA, et maintenant l'IA a révolutionné GeForce. Parlons de l'IA à notre siège social.
C'est littéralement notre bureau.
L'industrie fait la course pour mettre l'IA à l'échelle. La loi de mise à l'échelle stipule que plus on applique de données, des modèles plus grands et de puissance de calcul, plus le modèle devient performant. Nous nous tournons vers davantage de données multimodales, comme la vidéo et le son. Deux autres lois de mise à l'échelle ont émergé. La mise à l'échelle post-entraînement utilise des techniques comme l'apprentissage par renforcement à partir du feedback humain pour affiner les compétences de l'IA. La génération de données synthétiques est comme un auto-entraînement, permettant à une IA de s'améliorer en résolvant des problèmes vérifiables. La troisième loi est la mise à l'échelle au moment du test, qui se concentre sur la quantité de calcul à utiliser pour le raisonnement afin de produire de meilleures réponses. Nous voyons ces lois en action avec des systèmes comme ChatGPT et Gemini. Les lois de mise à l'échelle génèrent une demande énorme pour Blackwell. Blackwell est en pleine production.
Chaque fournisseur de services cloud dispose désormais de systèmes opérationnels. Nous avons des configurations de 15 fabricants d'ordinateurs dans 200 versions différentes, y compris des versions refroidies par liquide et par air. Ces systèmes sont actuellement fabriqués dans 45 usines, montrant à quel point l'IA est devenue omniprésente.
La raison pour laquelle nous poussons si fort est que nous avons besoin de plus de puissance de calcul. Janine ?
C'est difficile à dire. On n'a pas envie de mettre ses mains dans un endroit sombre. Est-ce une bonne idée ?
Attendez.
Je pensais que j'en étais digne ; apparemment, Mjolnir ne le pensait pas. Voici le GB200 NVLink 72. Il pèse une tonne et demie, compte 600 000 pièces et trois kilomètres de câble en cuivre. Il est fabriqué dans 45 usines. Blackwell améliore les performances par watt d'un facteur quatre et les performances par dollar d'un facteur trois. Nous avons considérablement réduit le coût de l'entraînement de ces modèles. Ces systèmes génèrent des jetons d'IA consommés par des applications comme ChatGPT. Comme les centres de données sont limités en puissance, l'efficacité de Blackwell multiplie la capacité commerciale par quatre. Ce sont les usines d'IA d'aujourd'hui. Nous avons créé ce qui est essentiellement une puce géante. 72 GPU Blackwell fournissent 1,4 exaflops de performance d'IA et 14 téraoctets de mémoire. La bande passante mémoire est de 1,2 pétaoctets par seconde, ce qui équivaut au trafic internet mondial total. C'est le miracle du système Blackwell.
L'IA Agentique et les Microservices NIM
Nous avons besoin d'une puissance de calcul énorme pour entraîner des modèles plus grands. À l'avenir, les IA se parleront à elles-mêmes et réfléchiront. Nous avons besoin que les taux de génération de jetons augmentent tout en réduisant les coûts. C'est pourquoi nous avons créé NVLink. Un exemple parfait de mise à l'échelle au moment du test est l'IA agentique, où plusieurs modèles travaillent en arrière-plan pour répondre à un utilisateur. Pour aider l'industrie, nous travaillons avec les développeurs de logiciels et l'écosystème informatique. Nous avons créé les NVIDIA NIM, qui sont des microservices d'IA optimisés emballés dans des conteneurs. Ceux-ci s'exécutent dans chaque cloud. NVIDIA NeMo est un système pour l'intégration et la formation d'employés numériques. Les services informatiques deviendront comme des RH pour les agents d'IA. Nous fournissons également des modèles open-source pour différents types d'agents. Aujourd'hui, nous annonçons les modèles de base de langage NVIDIA Llama-NeMoTron, optimisés pour un usage en entreprise. Ces modèles sont en tête des classements de chat et d'instructions. Nous travaillons avec des partenaires comme ServiceNow, SAP, Siemens et Perplexity. Le codage sera le prochain service d'IA géant pour 30 millions d'ingénieurs. Les agents d'IA représentent une opportunité de plusieurs milliers de milliards de dollars. Laissez-moi vous montrer quelques modèles.
Les agents d'IA sont la nouvelle main-d'œuvre numérique. Ils raisonnent sur des missions, les divisent en tâches et utilisent des outils pour générer des réponses de qualité. Les frameworks NIM et NeMo de NVIDIA permettent aux organisations de développer et de déployer des agents n'importe où. Nous les intégrons comme des employés. Par exemple, des assistants de recherche IA peuvent ingérer des documents complexes pour générer des podcasts interactifs.
En combinant un modèle de régression UNet avec un modèle de diffusion, CorrDiff peut réduire l'échelle des prévisions météorologiques de 25 kilomètres à 2 kilomètres.
Chez NVIDIA, les développeurs gèrent des agents de sécurité qui recherchent des vulnérabilités et les alertent des actions nécessaires.
Les agents Virtual Lab aident à concevoir des candidats-médicaments. Les agents Metropolis analysent les vidéos de milliards de caméras pour la recherche, la synthèse et la surveillance du trafic. Dans les installations industrielles, ils génèrent des recommandations et réorientent les travailleurs lors d'incidents. L'ère de l'IA agentique est arrivée.
L'IA sur PC et Windows
Ce lancer de baseball n'était pas généré ; j'ai juste senti que vous n'étiez pas impressionnés. L'IA a été créée dans et pour le cloud, mais nous voulons l'emmener partout, y compris sur le PC. Windows 95 a révolutionné l'informatique, mais le modèle n'est pas parfait pour l'IA. À l'avenir, votre IA deviendra votre assistant via des API génératives. Nous voulons faire de Windows un PC IA de classe mondiale. La réponse est Windows WSL2, qui est optimisé pour CUDA. Les NVIDIA NIM et les modèles fonctionneront parfaitement sur votre PC. Notre objectif est de transformer le PC Windows en une plateforme d'IA de premier ordre. Laissez-moi vous montrer un exemple de modèle.
Avec NVIDIA NIM, les créateurs peuvent utiliser des objets 3D pour guider la génération d'images par l'IA. Un concepteur artistique peut disposer des ressources 3D pour créer un visuel qui adhère à la scène. En ajoutant des objets ou en changeant les angles de caméra, un artiste peut rapidement concrétiser sa vision.
IA Physique et Modèle de base Cosmos
Des centaines de millions de PC Windows se préparent pour l'IA. Parlons de l'IA physique. Les grands modèles de langage génèrent des jetons un par un, ce qui est exigeant en calcul. Si nous remplaçons l'invite textuelle par l'environnement et la sortie par des jetons d'action, nous avons l'avenir de la robotique. Nous avons besoin d'un modèle de base mondial qui comprenne la gravité, la friction et la relation de cause à effet. Aujourd'hui, nous annonçons NVIDIA Cosmos, un modèle de base mondial conçu pour comprendre le monde physique.
NVIDIA Cosmos est une plateforme de développement de modèles de base mondiaux. Elle comprend des modèles autorégressifs et basés sur la diffusion ainsi qu'un pipeline de données accéléré par l'IA. Cosmos génère des états de mondes virtuelles sous forme de vidéos, en privilégiant la permanence des objets et l'éclairage. Les développeurs utilisent Omniverse pour construire des scénarios et Cosmos pour générer des données synthétiques photoréalistes pour les tests et la validation. Cosmos apporte le pouvoir de la prévision aux modèles d'IA.
NVIDIA Cosmos est entraîné sur 20 millions d'heures de vidéo pour enseigner à l'IA le monde physique. Il peut être utilisé pour la génération de données synthétiques, le sous-titrage et l'entraînement de robots. La plateforme est sous licence ouverte et disponible sur GitHub. Nous espérons que Cosmos fera pour la robotique ce que Llama 3 a fait pour l'IA d'entreprise. Lorsqu'il est connecté à Omniverse, il fournit une simulation ancrée. Pour la numérisation industrielle, chaque usine finira par avoir un jumeau numérique. Nous nous associons à KION et Accenture pour apporter l'IA physique au marché de l'entreposage.
KION, Accenture et NVIDIA apportent l'IA physique au marché de l'entreposage. KION adopte Mega, un modèle NVIDIA Omniverse, pour construire des jumeaux numériques afin d'optimiser les flottes robotiques. Les robots perçoivent et raisonnent sur leur environnement de jumeau numérique avant d'agir. KION peut désormais simuler des scénarios infinis pour mesurer le débit et l'efficacité avant de déployer des changements.
Véhicules Autonomes et Partenariat avec Toyota
À l'avenir, chaque usine aura un jumeau numérique. La révolution des véhicules autonomes est arrivée. Nous proposons trois ordinateurs : les systèmes d'entraînement, les systèmes de simulation et l'ordinateur à l'intérieur de la voiture. Nous travaillons avec des entreprises comme Waymo, Tesla, Mercedes et Toyota. Je prédis que ce sera la première industrie robotique de plusieurs milliers de milliards de dollars. Notre ordinateur de voiture de nouvelle génération est Thor. Thor est 20 fois plus performant que notre génération précédente et est maintenant en pleine production. Drive OS est le premier ordinateur IA défini par logiciel certifié ASIL D, la norme de sécurité la plus élevée. Maintenant, voyons comment nous utilisons Omniverse et Cosmos pour reconstruire des jumeaux numériques afin d'entraîner les futurs modèles d'IA.
La construction de véhicules autonomes nécessite trois ordinateurs : DGX pour l'entraînement, Omniverse pour la simulation et Drive AGX pour la voiture. Ces ordinateurs travaillent de manière interactive. La stratégie de NVIDIA pour le monde industriel est ce système à trois ordinateurs.
Il existe des millions d'usines qui forment l'épine dorsale d'une industrie manufacturière de 50 000 milliards de dollars. Tout cela doit devenir défini par logiciel et imprégné de robotique. Nous travaillons avec KION et Accenture pour créer quelque chose de spécial. Tout le monde veut numériser l'avenir des industries.
KION, Accenture et NVIDIA apportent l'IA physique au marché de l'entreposage de 1 000 milliards de dollars. KION utilise le modèle Mega pour les jumeaux numériques industriels. La flotte de robots perçoit et raisonnent sur l'environnement pour planifier ses mouvements. KION peut simuler des scénarios à grande échelle pour mesurer les indicateurs de performance opérationnelle avant le déploiement.
Chaque usine aura un jumeau numérique. La révolution des VA est arrivée. Nous travaillons avec de grandes entreprises automobiles comme Waymo, Tesla et BYD. J'ai le plaisir d'annoncer que Toyota et NVIDIA s'associent pour leur prochaine génération de VA.
Les véhicules autonomes seront une industrie de plusieurs milliers de milliards de dollars. Thor, notre processeur de nouvelle génération, est un ordinateur robotique universel en pleine production. Sa capacité est 20 fois supérieure à celle d'Orin. Drive OS a été certifié ASIL D, la norme de sécurité fonctionnelle la plus élevée. Voyons comment nous utilisons la voiture pour reconstruire des jumeaux numériques.
Construire des véhicules autonomes sûrs nécessite des données synthétiques. L'usine de données VA, propulsée par Omniverse et Cosmos, génère des scénarios de conduite pour améliorer l'entraînement. OmniMap construit des environnements 3D, tandis qu'un moteur de reconstruction neuronale crée une simulation 4D à partir des journaux des capteurs. Cosmos génère des données photoréalistes, réduisant l'écart entre simulation et réalité. Cela définit la norme pour la conduite autonome avancée.
Robotique Humanoïde et Projet DIGITS
Nous aurons des montagnes de données d'entraînement pour les véhicules autonomes. Le moment ChatGPT pour la robotique est proche. Les robots humanoïdes sont importants car ils peuvent être déployés dans le monde que nous avons construit pour nous-mêmes. La capacité critique est de les entraîner. Nous utilisons l'IA et Omniverse pour générer synthétiquement des millions de mouvements à partir de démonstrations humaines. Laissez-moi vous montrer comment cela se fait.
NVIDIA Isaac GR00T fournit des modèles de base de robots, des pipelines de données et l'ordinateur Thor. GR00T-Teleop permet aux travailleurs de commander un jumeau numérique à l'aide de l'Apple Vision Pro pour capturer des données. GR00T-Mimic multiplie ces trajectoires en un ensemble de données plus vaste, et GR00T-Gen utilise Cosmos pour la randomisation de domaine. Cela permet aux développeurs de valider des politiques en simulation avant de les déployer sur des robots réels.
NVIDIA Isaac GR00T accélère le développement de la robotique générale. Enfin, je veux vous montrer notre dernier superordinateur d'IA. En 2016, j'ai livré le premier DGX-1 à OpenAI. Désormais, chaque ingénieur et chaque artiste a besoin d'un superordinateur d'IA. Le projet DIGITS est notre dernier né, exécutant toute la pile d'IA de NVIDIA. Il est basé sur une puce secrète appelée GB110, un SoC Grace Blackwell construit en collaboration avec MediaTek. Cette petite chose est en pleine production et sera disponible vers le mois de mai. C'est une plateforme cloud qui tient sur votre bureau.
Cette puce est incroyable. Qui n'en voudrait pas ? C'est une plateforme de cloud computing pour PC ou Mac. Vous pouvez même les connecter ensemble pour former une pile de supercalcul. Nous sommes en production avec trois nouveaux systèmes Blackwell et le modèle de base mondial Cosmos. Ce fut une année incroyable. Merci pour votre partenariat. Bonne année.