La plupart des benchmarks de LLM ne s’appuient pas sur une méthode fiable

Publié le : jeudi 13 novembre 2025 à 11:41

Les benchmarks de LLM pullulent mais aucun, ou presque, ne semble s’appuyer sur un travail réellement scientifique, analysent des chercheurs. Ils appellent à une plus grande rigueur. À chaque publication d’un nouveau modèle pour l’IA générative, l’entreprise qui l’a conçu nous montre par des graphiques qu’il égale ou surpasse ses congénères, en s’appuyant sur des […]

Lire le reste de l'article sur NEXT INpact.