Richard Sutton

L'apprentissage et les buts des modèles de langage

28 octobre 2025

Intelligence Artificielle
Illustration de Richard Sutton

L'arrêt de l'apprentissage après la création

Richard Sutton

Nous venons de remarquer qu'ils n'apprennent pas pendant qu'ils fonctionnent. Ils n'apprennent plus. L'apprentissage est autorisé, l'apprentissage automatique intervient dans leur création, mais une fois créés, ils n'apprennent plus.

L'absence de buts et de récompenses

Richard Sutton

Et en fait, ils ne peuvent pas apprendre parce qu'ils n'ont pas de but. Ils n'ont pas de récompense. Ils imitent les gens, et les gens ont des buts, mais les grands modèles de langage eux-mêmes n'ont aucun but et aucun moyen de savoir quand ils disent quelque chose de correct ou d'incorrect.