☕️ Les tentatives de chantage de Claude seraient dûes à des fictions sur l’IA
Source : NEXT INpact
Publié le : mardi 12 mai 2026 à 09:43
En 2025, Anthropic publiait Opus 4 et Sonnet 4, deux modèles salués pour leurs capacités de développement, mais dont l’un, Opus 4, s’avérait parfois tenter de… faire chanter ses utilisateurs. Dans certains exercices de « red teaming », les constructeurs avaient glissé dans les données de la machine des mails fictifs d’une entreprise tout aussi fictive. L’un […]