Énergie
Inférence (Inférence (IA))
Définition : Phase d'usage d'un modèle IA, quand il répond aux requêtes, par opposition à l'entraînement. C'est elle qui domine désormais la consommation.
En détail
L'inférence consiste à faire tourner un modèle déjà entraîné pour produire une réponse. À distinguer de l'entraînement, la création du modèle, événement ponctuel mais très intensif. En 2026, l'inférence représente la majeure partie de l'énergie consommée sur la vie d'un modèle (de l'ordre de 60 à 90 %), car elle se répète à chaque requête et son volume explose. Le vrai enjeu environnemental de l'IA est donc l'usage agrégé, pas l'entraînement.