L'intelligence artificielle
par ceux qui la créent.
« Exploration des frontières technologiques à travers les mots d'Elon Musk, Dario Amodei, Sam Altman et les plus grands esprits de la tech. »
John Schulman
7 Entretiens
L'évolution de la recherche en IA : d'OpenAI à Thinking Machines
John Schulman, co-fondateur d'OpenAI et de Thinking Machines, revient sur les débuts de ChatGPT, l'évolution de la culture de recherche en IA, et présente sa nouvelle plateforme Tinker.
Entretien avec John Schulman : OpenAI, Mise à l'échelle et ChatGPT
John Schulman, cofondateur d'OpenAI, partage son parcours de la robotique à l'IA, l'évolution d'OpenAI vers les produits, les défis techniques de la mise à l'échelle et de l'infrastructure avec Ray, ainsi que la genèse de ChatGPT.
John Schulman : Post-entraînement, AGI et l'avenir du RL
John Schulman, cofondateur d'OpenAI, discute des nuances entre le pré-entraînement et le post-entraînement, de la trajectoire vers l'AGI, du raisonnement à long horizon et de la création de ChatGPT.
L'Architecte de ChatGPT : Une Conversation avec John Schulman
John Schulman, co-fondateur d'OpenAI et architecte principal de ChatGPT, discute du développement des modèles de langage, de l'apprentissage par renforcement à partir des retours humains (RLHF) et de l'avenir de l'IA avec Pieter Abbeel.
Berkeley AI Seminar: Truthfulness in Language Models
John Schulman, cofondateur d'OpenAI et architecte en chef de ChatGPT, discute des défis de la véracité et des hallucinations dans les modèles de langage, explorant comment l'apprentissage par renforcement et la recherche d'informations peuvent améliorer la factualité.
The Nuts and Bolts of Deep RL Research
John Schulman, chercheur chez OpenAI, présente des conseils pratiques et des astuces pour la recherche en apprentissage par renforcement profond (Deep RL), couvrant la résolution de nouveaux problèmes, le réglage des hyperparamètres et les diagnostics d'algorithmes.
Fondamentaux de l'apprentissage par renforcement profond
John Schulman, chercheur chez OpenAI, présente les concepts clés de l'apprentissage par renforcement profond, explorant les méthodes de gradient de politique, les fonctions Q, et les applications concrètes allant de la robotique à la traduction automatique.