☕️ Les tentatives de chantage de Claude seraient dûes à des fictions sur l’IA

Source : NEXT INpact

Publié le : mardi 12 mai 2026 à 09:43

En 2025, Anthropic publiait Opus 4 et Sonnet 4, deux modèles salués pour leurs capacités de développement, mais dont l’un, Opus 4, s’avérait parfois tenter de… faire chanter ses utilisateurs. Dans certains exercices de « red teaming », les constructeurs avaient glissé dans les données de la machine des mails fictifs d’une entreprise tout aussi fictive. L’un […]

Lire le reste de l'article sur NEXT INpact.