Anthropic (créateur de Claude) a lancé une grande étude pour (enfin) comprendre comment fonctionne les LLM. Les grands modèles de langage présentent des capacités impressionnantes. Cependant, leurs mécanismes demeurent pour la plupart inconnus. Leur nature « boîte noire » est de moins en moins satisfaisante à mesure que leur intelligence progresse et qu'ils sont déployés dans un nombre croissant d'applications. L'objectif de l'étude est de rétroconcevoir le fonctionnement interne de ces modèles afin de mieux les comprendre et d'évaluer leur adéquation.
Johan Puisais en parle dans cette vidéo :