Statistiques à deux variables
Série d'entraînement : Ajustements affines, exponentiels et logarithmiques
Exercice 1 : Chiffre d'affaires d'une Start-up
Le chiffre d'affaires $y$ (en milliers d'euros) d'une jeune entreprise est suivi sur 5 ans ($x$ est le rang de l'année) :
| Année $x_i$ | 1 | 2 | 3 | 4 | 5 |
|---|---|---|---|---|---|
| CA $y_i$ | 120 | 165 | 210 | 295 | 375 |
- Calculer les coordonnées du point moyen $G$ du nuage.
- Déterminer l'équation de la droite de régression de $y$ en $x$ par les moindres carrés.
- À l'aide de ce modèle, estimer le chiffre d'affaires à l'année 8.
- Calculer le coefficient de corrélation linéaire $r$. L'ajustement affine est-il de bonne qualité ?
Corrigé détaillé de l'Exercice 1
1. Coordonnées du point moyen $G$ :
Calculons la moyenne des abscisses : $\bar{x} = \dfrac{1+2+3+4+5}{5} = \dfrac{15}{5} = 3$.
Calculons la moyenne des ordonnées : $\bar{y} = \dfrac{120+165+210+295+375}{5} = \dfrac{1165}{5} = 233$.
Le point moyen a pour coordonnées $G\left( 3 \ ; \ 233 \right)$.
2. Équation de la droite de régression :
Par la méthode des moindres carrés, on obtient l'équation affine $y = ax + b$ avec :
$a = \dfrac{\sum (x_i-\bar{x})(y_i-\bar{y})}{\sum (x_i-\bar{x})^2} = 65,5$ et $b = \bar{y} - a\bar{x} = 233 - 65,5 \times 3 = 36,5$.
L'équation est donc : $y = 65,5x + 36,5$.
3. Estimation pour l'année 8 :
On remplace $x$ par $8$ dans l'équation de la droite :
$y = 65,5 \times 8 + 36,5 = 524 + 36,5 = $ $560,5 \text{ k€}$.
4. Qualité de l'ajustement :
Le coefficient de corrélation linéaire est $r \approx 0,993$.
Comme $|r|$ est très proche de 1, l'ajustement affine est de très bonne qualité.
Exercice 2 : Évolution de l'indice TIC
On étudie l'indice de consommation des produits TIC entre 2000 et 2008 :
| Rang $x_i$ | 0 | 1 | 2 | 3 | 4 |
|---|---|---|---|---|---|
| Indice $y_i$ | 100 | 114,1 | 131,2 | 147,1 | 166,6 |
| Rang $x_i$ | 5 | 6 | 7 | 8 |
|---|---|---|---|---|
| Indice $y_i$ | 189,6 | 219,4 | 251,0 | 268,1 |
- Déterminer l'équation de la droite d'ajustement affine de $y$ en $x$.
- Soit un modèle exponentiel $f(x) = 101e^{0,13x}$. Résoudre l'inéquation $f(x) \geq 350$.
Corrigé détaillé de l'Exercice 2
1. Ajustement affine :
Calcul des moyennes : $\bar{x} = 4$ et $\bar{y} = \dfrac{100+114,1+\dots+268,1}{9} \approx 176,34$.
La calculatrice donne pour équation : $y = 22,08x + 88,01$.
2. Résolution de l'inéquation exponentielle :
On résout $101e^{0,13x} \geq 350$ donc $e^{0,13x} \geq \dfrac{350}{101} \approx 3,4653$.
En appliquant la fonction logarithme népérien (croissante sur $\mathbb{R}^{+}_{*}$) :
$\ln\left( e^{0,13x} \right) \geq \ln\left( 3,4653 \right)$ donc $0,13x \geq 1,2428$.
$x \geq \dfrac{1,2428}{0,13} \approx 9,56$.
L'indice dépassera 350 à partir de l'année de rang $x = 10$.
Exercice 3 : Croissance des internautes en Chine
Nombre d'internautes $y$ (millions) entre 2002 et 2009 ($x$ : rang par rapport à 2000) :
| Rang $x_i$ | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
|---|---|---|---|---|---|---|---|---|
| Internautes $y_i$ | 60 | 70 | 95 | 103 | 137 | 162 | 253 | 384 |
- On pose $z = \ln(y)$. Déterminer l'ajustement affine de $z$ en $x$.
- En déduire l'ajustement exponentiel $y = Ae^{Bx}$.
Corrigé détaillé de l'Exercice 3
1. Ajustement linéaire sur le logarithme :
On transforme les ordonnées en prenant le logarithme népérien : $z_1 = \ln(60) \approx 4,0943$ ; $z_2 = \ln(70) \approx 4,2485$, etc.
Par régression linéaire sur $\left( x_i \ ; \ z_i \right)$, on trouve : $z = 0,253x + 3,514$.
2. Passage au modèle exponentiel :
$\ln(y) = 0,253x + 3,514$ donc $y = e^{0,253x + 3,514} = e^{3,514} \times e^{0,253x}$.
On calcule $A = e^{3,514} \approx 33,5827$.
L'ajustement exponentiel est donc : $y = 33,58 e^{0,253x}$.
Exercice 4 : Fréquentation aérienne
Passagers (millions) depuis 1980 ($x$ est le rang par rapport à 1980) :
| Rang $x_i$ | 0 | 5 | 10 | 15 | 20 | 25 | 28 |
|---|---|---|---|---|---|---|---|
| Passagers $y_i$ | 21,9 | 26,4 | 36,9 | 44,7 | 67 | 82 | 97,9 |
- Justifier par le calcul pourquoi un ajustement affine n'est pas optimal.
- Prédire le nombre de passagers en 2011 avec le modèle $y = 20,99 e^{0,055x}$.
Corrigé détaillé de l'Exercice 4
1. Étude de l'augmentation absolue :
Calculons l'augmentation moyenne par an sur deux périodes distinctes :
- Période 1 (1980-1985) : $\dfrac{26,4 - 21,9}{5} = 0,9 \text{ M/an}$.
- Période 2 (2005-2008) : $\dfrac{97,9 - 82}{3} \approx 5,3 \text{ M/an}$.
L'augmentation annuelle n'est pas constante mais s'accélère fortement au cours du temps, ce qui rend l'ajustement affine peu adapté (le nuage présente une courbure).
2. Prédiction pour l'année 2011 :
En 2011, le rang est $x = 2011 - 1980 = 31$.
Calculons $y = 20,99 e^{0,055 \times 31} \approx 20,99 \times e^{1,705} \approx 20,99 \times 5,5013$.
Le nombre de passagers estimé est : $y \approx 115,44 \text{ millions}$.
Exercice 5 : Croissance d'un Séquoia
Étude de la hauteur $H$ (m) d'un séquoia en fonction de son âge $x$ (années) :
| Âge $x_i$ | 1 | 5 | 10 | 20 | 50 | 100 |
|---|---|---|---|---|---|---|
| Hauteur $H_i$ | 1,2 | 6,5 | 9,4 | 12,6 | 17,2 | 20,5 |
- On effectue le changement de variable $X = \ln(x)$. Donner l'équation de la droite de régression de $H$ en $X$ (arrondir à $10^{-2}$).
- En déduire l'expression de $H$ en fonction de $x$.
- Estimer la hauteur de l'arbre à 200 ans.
Corrigé détaillé de l'Exercice 5
1. Ajustement logarithmique :
On transforme les abscisses par le logarithme népérien : $X_1 = \ln(1) = 0$ ; $X_2 = \ln(5) \approx 1,6094$ ; $X_3 = \ln(10) \approx 2,3026$, etc.
Par régression linéaire sur le nouveau couple $\left( X_i \ ; \ H_i \right)$, on obtient l'équation affine :
$H = 4,21 X + 0,55$.
2. Expression du modèle :
En substituant $X$ par $\ln(x)$, on obtient le modèle de croissance suivant :
$H(x) = 4,21 \ln(x) + 0,55$.
3. Estimation à 200 ans :
Calculons $H(200) = 4,21 \times \ln(200) + 0,55 \approx 4,21 \times 5,2983 + 0,55 \approx 22,3058 + 0,55$.
La hauteur estimée de l'arbre est : $H \approx 22,86 \text{ m}$.