Voici le décodage spéculatif : grâce à lui, les modèles d'IA vont devenir plus rapides, et consommer moins de ressources
Source : Clubic
Publié le : mercredi 16 juillet 2025 à 17:33
Intel et l'Institut Weizmann ont présenté, mercredi, une technique de « décodage spéculatif », capable d'accélérer l'inférence des modèles d'intelligence artificielle jusqu'à 2,8 fois, sans tailler dans la qualité des réponses.