xAI n'utiliserait que 11 % de son énormissime parc de GPU NVIDIA
Source : CowcotLand
Publié le : mardi 5 mai 2026 à 05:35
Selon les informations rapportées par The Information et relayées par Wccftech, xAI rencontrerait actuellement un sérieux problème d'exploitation de son infrastructure GPU. La société d'Elon Musk disposerait d'un parc d'environ 550 000 GPU NVIDIA, principalement des H100 et H200, déployés notamment au sein de ses clusters de Memphis et de Colossus. Mais malgré cette force de frappe colossale sur le papier, xAI n'exploiterait réellement qu'environ 11 % de cette capacité. En clair, cela reviendrait à utiliser efficacement l'équivalent d'environ 60 000 GPU, alors que plus d'un demi-million de cartes seraient installées dans les serveurs de l'entreprise. Le problème ne viendrait donc pas du matériel en lui-même, mais plutôt de la capacité à faire travailler tout ce petit monde de façon coordonnée et efficace. Le logiciel, vrai goulet d'étranglement de l'IA à très grande échelle Le souci viendrait principalement de la pile logicielle et de l'optimisation du réseau d'entraînement distribué. À petite ou moyenne échelle, avec quelques milliers de GPU, les pertes d'efficacité peuvent rester acceptables. Mais lorsque l'on parle de centaines de milliers de GPU, le moindre temps mort se transforme rapidement en gouffre de performance. Les GPU peuvent alors attendre des données, patienter entre deux étapes de calcul ou subir des ralentissements dans les pipelines d'analyse. […]