Richard Sutton
L'apprentissage et les buts des modèles de langage
28 octobre 2025
Intelligence Artificielle
L'arrêt de l'apprentissage après la création
Richard Sutton
Nous venons de remarquer qu'ils n'apprennent pas pendant qu'ils fonctionnent. Ils n'apprennent plus. L'apprentissage est autorisé, l'apprentissage automatique intervient dans leur création, mais une fois créés, ils n'apprennent plus.
L'absence de buts et de récompenses
Richard Sutton
Et en fait, ils ne peuvent pas apprendre parce qu'ils n'ont pas de but. Ils n'ont pas de récompense. Ils imitent les gens, et les gens ont des buts, mais les grands modèles de langage eux-mêmes n'ont aucun but et aucun moyen de savoir quand ils disent quelque chose de correct ou d'incorrect.