La plupart des benchmarks de LLM ne s’appuient pas sur une méthode fiable
Source : NEXT INpact
Publié le : jeudi 13 novembre 2025 à 11:41
Les benchmarks de LLM pullulent mais aucun, ou presque, ne semble s’appuyer sur un travail réellement scientifique, analysent des chercheurs. Ils appellent à une plus grande rigueur. À chaque publication d’un nouveau modèle pour l’IA générative, l’entreprise qui l’a conçu nous montre par des graphiques qu’il égale ou surpasse ses congénères, en s’appuyant sur des […]