clean_Decoding_Fuel_Consumption

Published on
Embed video
Share video
Ask about this video

Scene 1 (0s)

ANATOMIE DE LA CONSOMMATION : CE QUI FAIT VRAIMENT BOIRE NOS MOTEURS. Analyse statistique multivariée et modélisation prédictive d'un parc de 31 véhicules..

Scene 2 (10s)

Les Suspects : Un parc automobile sous Ia loupe Un échantillon hautement hétérogéne : 31 véhicules, de la citadine ultralégére å la supercar de grand tourisme. Min: 650 kg Max: 2250 kg (Daihatsu Cuore) Poids (Mercedes S 600) Min: 29 kW Min: 10 450 Frs Max: Puissance 325 kW Min: 5.7 L/100km Max: 21.3 L/100km Min: 29 kW Puissance Max: 325 kW prix Max: 285 OOO Frs Consommation.

Scene 3 (29s)

La Matrice des Corrélations : Vue Macro Puissance Cylindrée Consommation Prix Poids Vue Radar : La puissance brute semble étre le facteur prédictif individuel le plus puissant. Tout est interconnecté..

Scene 4 (40s)

Le Poids : L'ennemi naturel de I'efficience Consumption vs Weight 20 15 10 Véhicules urbains < 800kg 1000 Secteur Luxe > 1600kg 2000 1500 Weight (kg) Une relation linéaire classique. Plus la masse å mouvoir est importante, plus l'énergie requise augmente de maniére prévisible..

Scene 5 (51s)

Puissance et Cylindrée : Le duo infernal Consumption vs Power Consumption vs Engine Corrélation interne massive : r = 0.96 50 100 200 150 Power 250 300 1000 2000 3000 4000 Engine 5000 6000 Aux extrémes, Ie comportement devient erratique (hétéroscédasticité). La cylindrée et Ia puissance racontent presque exactement Ia méme histoire statistique..

Scene 6 (1m 4s)

Le défi de Ia modélisation multivariée Puissance Zone de o Redondance (Colinéarité) prix Additionner les effets simples fausserait la prédiction. Comment isoler l'impact réel de chaque variable quand elles se chevauchent si fortement ?.

Scene 7 (1m 14s)

Le Modéle Complet : L'anomalie statistique R2 ajusté = 94.15% (Excellente précision globale) •diiiiiiiiiiiiiiiii Poids : *** (Hautement significatif) (Significatif) Puissance : * (Significatif) prix : Cylindrée : 0.305 (Non significatif) L'anomalie : Intégrée au modéle complet, la Cylindrée obtient un coefficient négatif (-6.281e-04) et perd toute significativité statistique. Pourquoi ?.

Scene 8 (1m 30s)

Résolution du mystere : Le piöge de Ia colinéarité Cylindrée Puissance + Poids Génére du bruit Absorbe le pouvoir prédictif mathématique Le modéle nous dit : Si je connais déjå la puissance et le poids d'une voiture, connaitre sa cylindrée ne m'aide plus å prédire sa consommation. Cela m'induit méme en erreur..

Scene 9 (1m 44s)

L'Optimisation : La méthode Stepwise AIC Modéle complet (4 variables) AIC = -5.07 Power • Weight • Cylindrée • Price Algorithme Stepwise : Élagage des variables redondantes pour maximiser le signal. Modéle optimisé (3 variables) AIC = -5.80 Cylindrée Power • Weight Price Principe de parcimonie : Moins de variables, plus de robustesse..

Scene 10 (1m 58s)

Le Modéle Final : L'équation gagnante La premium automotive amthche Extended Consommation = Constante + ) +f(Puissance) +f(p Poids Poids + 3.576e-03 L par kilo Puissance + 1.929e-02 L par kW R2 ajusté maintenu å 94.13%. Toutes les variables sont désormais strictement significatives. prix + 1.988e-05 L par Franc.

Scene 11 (2m 12s)

Sous Ie capot : Diagnostics de validité (1/2) Résidus vs Valeurs Ajustées o Scale-Location • 00. 000 10 Statut : 0K 15 20 00 10 15 20 Inter Inter Absence de biais systémique. Le modéle se trompe, mais il se trompe de maniére aléatoire et non prévisible. La structure mathématique est saine..

Scene 12 (2m 27s)

Sous Ie capot : Diagnostics de validité (2/2) Normal Q-Q Plot •006 •ö Theoretical Quantiles Validation de la Normalité : Les erreurs suivent une courbe de Gauss classique, å l'exception notable de quelques cas extrémes aux marges..

Scene 13 (2m 39s)

Les 'Outliers' : Ceux qui défient Ia norme Residuals vs Leverage 1.0 0.5 - 0.0 -0.5 0.0 080 Cook's distance 0.2 0.4 0.6 0.8 Residuals vs Leverage 22 0.5 1.0 Points 22 & 80 : Supercars sportives. Point 9 : Berlines de tres grand luxe suréquipées. Ces anomalies cachent des réalités physiques. Leurs dynamiques thermodynamiques échappent aux standards des véhicules grand public..

Scene 14 (2m 58s)

Synthése : De I'intuition Ia preuve statistique L'lntuition Initiale La cylindrée est le mattre absolu de la consommation. Plus on ajoute de variables, plus la prédiction est précise. La Réalité Statistique La Puissance supplante totalement la cylindrée en raison d'une colinéarité massive. Un modéle épuré (3 variables) élimine le bruit mathématique et fiabilise le signal prédictif. Colinéarité : R2 = 0.98 Bruit Mathématique Signal Prédictif Optimisé Conclusion : Consommation = f(Puissance, Poids, Prix). Un modéle prédictif ÉNERGÉTIQUE robuste å 94.1% pour évaluer avec précision l'efficacité énergétique de tout parc automobile standard..