Terminale STMG maths

Ajustement statistique et prévisions

Cours complet sur l'ajustement statistique et les prévisions pour Terminale STMG : nuage de points, droite d'ajustement, corrélation, méthode pas à pas, exemple

L’ajustement statistique permet de modéliser une relation entre deux variables pour faire des prévisions. En STMG, vous l’utiliserez par exemple pour estimer des ventes futures à partir du budget publicitaire, ou prévoir le nombre de clients en fonction des heures d’ouverture. C’est un outil concret d’aide à la décision.

À retenir

  • Nuage de points : représentation graphique de couples de données (xi;yi)(x_i;y_i). Chaque point correspond à une observation.
  • Ajustement affine : on cherche une droite d’équation y=ax+by = ax + b qui résume la tendance du nuage.
  • Méthode des moindres carrés : la droite d’ajustement (droite de régression) minimise la somme des carrés des écarts entre les points et la droite.
  • Coefficient de corrélation linéaire rr : mesure la force et le sens de la relation linéaire. rr est compris entre 1-1 et 11. Plus r|r| est proche de 1, meilleur est l’ajustement.
  • Prévision : on utilise l’équation de la droite pour estimer yy pour une valeur donnée de xx. Attention, une prévision n’est jamais certaine, surtout si on extrapole loin des données.

Méthode pas à pas

  1. Représenter le nuage de points : placer les couples (xi;yi)(x_i;y_i) dans un repère.
  2. Observer la tendance : les points sont-ils alignés approximativement ? Si oui, un ajustement affine est pertinent.
  3. Déterminer l’équation de la droite d’ajustement : utiliser la calculatrice ou un logiciel pour obtenir y=ax+by = ax + b (ou les formules : a=cov(x,y)V(x)a = \frac{cov(x,y)}{V(x)}, b=yˉaxˉb = \bar{y} - a\bar{x}).
  4. Calculer le coefficient de corrélation rr : vérifier que r|r| est suffisamment proche de 1 (en général r>0,8|r| > 0,8 pour un ajustement acceptable).
  5. Faire une prévision : remplacer xx par la valeur souhaitée dans l’équation.
  6. Conclure avec prudence : indiquer que la prévision est une estimation, pas une certitude.

Exemple guidé

Un gérant de magasin étudie le lien entre le budget publicitaire (en milliers d’euros) et le chiffre d’affaires (en milliers d’euros) sur 5 mois :

Budget xxCA yy
210
312
515
618
820
  1. Nuage de points : les points semblent alignés.
  2. Calculs :
    • Moyennes : xˉ=4,8\bar{x} = 4,8, yˉ=15\bar{y} = 15.
    • Covariance : cov(x,y)=15(xixˉ)(yiyˉ)=6,8cov(x,y) = \frac{1}{5}\sum (x_i-\bar{x})(y_i-\bar{y}) = 6,8.
    • Variance de xx : V(x)=15(xixˉ)2=4,56V(x) = \frac{1}{5}\sum (x_i-\bar{x})^2 = 4,56.
    • Pente : a=6,84,561,49a = \frac{6,8}{4,56} \approx 1,49.
    • Ordonnée à l’origine : b=151,49×4,87,85b = 15 - 1,49 \times 4,8 \approx 7,85.
    • Équation : y=1,49x+7,85y = 1,49x + 7,85.
  3. Coefficient de corrélation : r0,98r \approx 0,98 (très proche de 1, ajustement excellent).
  4. Prévision : pour un budget de 7 milliers d’euros, y=1,49×7+7,8518,28y = 1,49 \times 7 + 7,85 \approx 18,28 milliers d’euros.
  5. Interprétation : avec un budget de 7000 €, le CA prévu est d’environ 18 280 €. Cette prévision est fiable car rr est élevé, mais attention à ne pas extrapoler au-delà de l’intervalle des données.

Exercices types

Exercice 1 : Un nuage de points a pour équation de droite y=3x+2y = 3x + 2. Quel est le yy prévu pour x=4x = 4 ?

Corrigé : y=3×4+2=14y = 3 \times 4 + 2 = 14.

Exercice 2 : Le coefficient de corrélation entre deux variables est r=0,9r = -0,9. Que peut-on dire de l’ajustement ?

Corrigé : r=0,9|r| = 0,9 proche de 1, donc ajustement linéaire fort, mais négatif : quand xx augmente, yy diminue.

Exercice 3 : On a xˉ=10\bar{x}=10, yˉ=50\bar{y}=50, a=2a=2. Calculer bb.

Corrigé : b=yˉaxˉ=502×10=30b = \bar{y} - a\bar{x} = 50 - 2 \times 10 = 30.

Exercice 4 : Pour un budget de 12 (en dehors des données), la prévision donne y=40y=40. Pourquoi faut-il être prudent ?

Corrigé : L’extrapolation suppose que la tendance linéaire se prolonge, ce qui n’est pas garanti. La prévision est moins fiable.

Pièges fréquents

  1. Confondre corrélation et causalité : même si rr est élevé, rien ne prouve que xx cause yy. Il peut y avoir un facteur caché.
  2. Extrapoler sans précaution : prévoir pour des xx très éloignés des données observées est risqué.
  3. Oublier les unités : les prévisions doivent être exprimées dans la même unité que yy.
  4. Forcer un ajustement affine : si le nuage est en forme de courbe ou très dispersé, un ajustement affine n’est pas pertinent.
  5. Négliger le coefficient de corrélation : même si la droite semble correcte, vérifiez rr pour confirmer la qualité de l’ajustement.

Questions fréquentes

Continuer à réviser

Passe à la pratique

Entraîne-toi avec des exercices et quiz pour ancrer ce que tu viens de réviser.

S'entraîner