✅ À retenir
- Loi \mathcal{N}(\mu,\sigma^2) : P(\mu-2\sigma \leq X \leq \mu+2\sigma) \approx 95\%.
- Droite de régression y sur x : y = ax+b avec a=\dfrac{\text{cov}(X,Y)}{V(X)}, b=\bar{y}-a\bar{x}.
- Coefficient de corrélation r : |r|\to 1 liaison forte, |r|\to 0 liaison faible.
📖 Définition — Variables aléatoires continues
Une variable aléatoire est continue s'il existe une fonction (densité) telle que :
Loi normale :
- ,
- Standardisation :
📖 Définition — Statistique à deux variables
Pour un nuage de points :
Droite de régression (moindres carrés) passant par :
🔢 Méthode — Calculer et interpréter la régression linéaire
- Calculer x̄, ȳ (moyennes).
- Calculer V(X) = x̄²_carr − x̄² (variance de X) et cov(X,Y) = x̄ȳ_moy − x̄ȳ.
- Calculer le coefficient directeur : a = cov(X,Y)/V(X).
- Calculer l'ordonnée à l'origine : b = ȳ − ax̄.
- Calculer r = cov/(σX×σY) et interpréter : |r|>0,9 → liaison très forte.
✏️ Exemple — Régression linéaire simple
Corrélation ≠ causalité. Deux variables peuvent être fortement corrélées sans que l'une cause l'autre. Exemple classique : la consommation de glaces et les noyades sont corrélées (r proche de 1) — mais c'est la chaleur qui cause les deux, pas les glaces !

La régression linéaire, c'est "la droite qui passe au mieux" à travers le nuage de points. Elle minimise la somme des carrés des distances verticales. L'intelligence artificielle et le machine learning, c'est de la régression généralisée — les maths du lycée sont au cœur de l'IA !
🎯 Mini-quiz
1. X ~ N(50, 10²). P(30 ≤ X ≤ 70) ≈ ?
2. Coefficient de corrélation r=−0,95. Cela signifie :
3. La droite de régression de y sur x passe toujours par :