Chapitre 4 : Statistiques - 3eme
Pré-requis
Vocabulaire de base.
Organisation des données.
Classement des données statistiques (séries brutes, séries ordonnées).
Calcul des effectifs, fréquences, pourcentages et moyennes.
Détermination de valeurs d'un caractère et des effectifs d'une série statistique à l'aide d'un diagramme, du mode.
Représentation (diagramme en bâtons, à bandes, circulaires, semi-circulaires).
Interprétation de données statistiques.
Projection orthogonale
Thalès
Compétences exigibles
$\bullet\ $Regrouper en classes une série brute.
$\bullet\ $Déterminer les tableaux des effectifs et des fréquences cumulées croissantes ou décroissantes.
$\bullet\ $Construire un histogramme
$\bullet\ $Interpréter un graphique représentant une série statistique.
$\bullet\ $Construire un diagramme cumulatif.
$\bullet\ $Déterminer la moyenne, la classe modale.
$\bullet\ $Déterminer, graphiquement et par le calcul, la médiane.
I. Vocabulaire
1. Population
L'ensemble sur lequel on recueille les données est appelé population.
2. Individu
Tout élément de la population est appelé individu.
3. Échantillon
Un échantillon est un sous ensemble de la population.
Remarque :
Lorsque l'effectif de l'échantillon est n, on dit qu'on a un échantillon de taille n.
4. Caractères
Un caractère est toute information qu'on peut étudier sur la population.
Exemple 1:
considérons l'ensemble des élèves d'une classe.
L'ensemble des élèves de la classe est une population.
Chaque élève de la classe est un individu
Un sous ensemble d'élèves de la classe forme un échantillon
Sur cette population, on peut étudier :
$-\ $le caractère « âge »
$-\ $le caractère « taille »
$-\ $le caractère « nationalité »
Exemple 2:
considérons l'ensemble des entreprises du Sénégal en 2000.
L'ensemble de ces entreprises est une population.
Chaque entreprise est un individu
Un sous ensemble d'entreprises forme un échantillon
Sur cette population d'entreprises, on peut étudier
$-\ $le caractère « nombre d'employés »
$-\ $le caractère « chiffre d'affaires de l'année $2000$ »
Remarque $1$
Un caractère est quantitatif ou qualitatif
a. Un caractère est quantitatif, lorsqu'il est mesurable.
Exemple : Sur une population d'étudiants, les caractères taille en centimètres et poids en $kg$ sont quantitatifs.
b. Un caractère est qualitatif, lorsqu'il n'est pas mesurable
Exemple : Sur une population d'étudiants, les caractères « nationalité » et « situation matrimoniale » sont qualitatifs.
Remarque $2$
Un caractère quantitatif est discret ou continu.
i. Un caractère est discret lorsqu'il prend des valeurs isolées
ii. Un caractère est continu lorsqu'il est susceptible de prendre toutes les valeurs d'un intervalle.
Exemple : Sur une population d'étudiants, le caractère « taille »
Remarque : dans le cadre du programme, on ne parlera pas explicitement de caractère continu.
5. Modalité
On appelle modalité toute valeur possible d'un caractère.
Exemple $1$ :
Sur une population d'étudiants, les modalités du caractère « mention obtenue au bac » sont :
Passable, Assez Bien, Bien, Très Bien.
Exemple $2$ : Considérons une population formée de quatre enfants d'une même famille, âgés respectivement de $12$ ; $8$ ; $3$ et $1$ ans.
Chacune de ces valeurs est une modalité du caractère âge.
Remarque
Dans le cas d'un caractère continu, les modalités sont appelées des classes.
Une classe est un intervalle du type $[a\ ;\ b[$, il est obtenu par regroupement des valeurs du caractère.
On admet que le centre d'une classe $a\ ;\ b[$[ est $c=\dfrac{a+b}{2}$ et l'amplitude est égale à $b-a$
i. Effectif d'une modalité
On appelle effectif d'une modalité $M$, le nombre d'individus pour lesquels le caractère prend la valeur $M.$
On appelle effectif d'une classe, le nombre d'individus pour lesquels le caractère prend une valeur appartenant à cette classe
ii. Fréquence d'une modalité
Soit $N$ l'effectif total d'une population.
Si $n_{i}$ représente l'effectif d'une modalité $M_{i}$ alors la fréquence de cette modalité est $f_{i}=\dfrac{n_{i}}{N}$ ou $f_{i}=\dfrac{100\times n_{i}}{N}\%$
lorsqu'elle est exprimée en pourcentage.
Soit $N$ l'effectif total d'une population.
Si $n_{i}$ représente l'effectif d'une classe $[a_{i}\ ;\ b_{i}[$ alors la fréquence de cette classe est $f_{i}=\dfrac{n_{i}}{N}$ ou $f_{i}=\dfrac{100\times n_{i}}{N}\%$ lorsqu'elle est exprimée en pourcentage.
6. Effectifs cumulés
Soit $X$ une variable statistique à caractère quantitatif dont les modalités sont notées dans l'ordre croissant $x_{1}\;,\ldots x_{2}\;,\ldots x_{n}$
On appelle effectif cumulé croissant de la modalité $x_{i}$, le nombre d'individus pour lesquels $x$ prend au plus la valeur $x_{i}$
On appelle effectif cumulé décroissant de la modalité $x_{i}$, le nombre d'individus pour lesquels $x$ prend au moins la valeur $x_{i}$
7. Fréquences cumulées
Soit $x$ une variable statistique à caractère quantitatif dont les modalités sont notées dans l'ordre croissant $x_{1}$ , $x_{2}$, $\ldots$ ,$x_{n}$
On appelle fréquence cumulée croissante de la modalité $x_{i}$, le rapport de l'effectif cumulé croissant de $x_{i}$ par l'effectif total.
On appelle fréquence cumulée décroissante de la modalité $x_{i}$, le rapport de l'effectif cumulé décroissant de $x_{i}$ par l'effectif total.
Remarque ;
Dans le cas où les modalités sont des classes, on définit de même les effectifs et fréquences cumulés
II- Tableaux
1. Tableaux statistiques
Un tableau statistique permet de rendre compte des modalités, des effectifs et des fréquences
$\begin{array}{|c|c|c|c|c|c|c|} \hline \text{Modalités }&x_{1}&x_{2}&x_{3}&\ldots&x_{p}&\text{Total}\\
\hline &&&&&&\\ \hline \text{Effectifs }&n_{1}&n_{2}&n_{3}&\ldots&n_{p}&N\\ \hline \text{Fréquences }&f_{1}&f_{2}&f_{3}&\ldots&f_{p}&1\\ \hline \end{array}$
Remarque : Série statistique et distribution statistique
Soit $x$ une variable discrète dont les modalités notées dans l'ordre croissant $x_{1}$ ,$x_{2}$, $\ldots$ ,$x_{p}$, sont d'effectifs respectifs $n_{1}$, $n_{2}$, $n_{3}$, $\ldots$, $n_{p}$ et de fréquences respectives $f_{1}$, $f_{2}$, $f_{3}$, $\ldots$, $f_{p}$
On appelle série statistique, l'ensemble noté $G_{x}$ défini par : $G=\left\lbrace\left(x_{i}\;,n_{i}\right)\ ;\ 1\leq i\leq p\right\rbrace$
On appelle distribution, l'ensemble noté $D_{x}$ défini par : $\left\lbrace\left(x_{1}\;,f_{i}\right)\ ;\ 1\leq i\leq p\right\rbrace$
Dans le cas d'une variable continue dont les classes sont $\left[a_{i}\;,b_{1}\right[\;,1\leq i\leq p$, d'effectifs respectifs $n_{1}$, $n_{2}$, $n_{3}$,$\ldots$ ,$n_{p}$ et de fréquences $f_{1}$, $f_{2}$, $f_{3}$, $\ldots$,$f_{p}$
La série statistique est $g_{x}=\left\lbrace\left(c_{i}\ ;\ n_{i}\right)\ ;\ 1\leq i\leq p\ ;\ 1\leq i\leq p\right\rbrace$ et la distribution est $D_{x}=\left\lbrace\left(c_{i}\;,f_{i}\right)\ ;\ 1\leq i\leq p\right\rbrace$, où ci est le centre de la classe $\left[a_{i}\;,b_{i}\right[$
2. Tableau cumulatif
Un tableau cumulatif, permet de rendre compte des modalités, des effectifs et des fréquences cumulés
$\begin{array}{|c|c|c|c|c|c|c|} \hline \text{Modalités }&x_{1}&x_{2}&x_{3}&\ldots&x_{p}&\text{Total}\\
\hline \text{Effectifs }&n_{1}&n_{2}&n_{3}&\ldots&n_{p}&N\\ \hline \text{Fréquences }&f_{1}&f_{2}&fa&\ldots&f_{p}&1\\ \hline ECC&n_{1}&n_{1}+n_{2}&n_{1}+n_{2}+n_{3}&\ldots&N&\\ \hline ECD&N&N-n_{1}&N-n_{1}-n_{2}&\ldots&n_{p}&\\ \hline F.C.C&f_{1}&f_{1}+f_{2}&f_{1}+f_{2}+f_{3}&\ldots&1&\\ \hline F.C.D&1&1-f_{1}&1 f_{1}-f_{2}&\ldots&f_{p}&\\ \hline \end{array}$
Exemple
Énoncée : Le tableau ci-dessous représente la répartition des notes d'une classe à l'issue d'un devoir surveillé de mathématiques.
Dresser le tableau des effectifs cumulés, et calculer les fréquences.
$\begin{array}{|c|c|c|c|c|c|c|c|c|} \hline \text{Classes }&[0\ ;\ 2[&[2\ ;\ 4[&[4\ ;\ 6[&[6\ ;\ 8[&[8\ ;\ 10[&[10\ ;\ 12[&[12\ ;\ 14[\\ \hline N_{i}&11&25&18&10&6&5&3&2\\ \hline \end{array}$
Correction
$\begin{array}{|c|c|c|c|c|c|c|c|c|} \hline \text{Classes }&[0\ ;\ 2[&[2\ ;\ 4[&[4\ ;\ 6[&[6\ ;\ 8[&[8\ ;\ 10[&[10\ ;\ 12[&[12\ ;\ 14[&[14\ ;\ 16[\\ \hline N_{i}&11&25&18&10&6&5&3&2\\ \hline f_{i }&0.14&0.31&0.23&0.12&0.08&0.06&0.04&0.02\\ \hline ECC&11&36&54&64&70&76&78&80\\ \hline ECD&80&69&44&26&16&10&5&2\\ \hline \end{array}$
III. Paramètre de position
a. Le mode
Le mode d'un caractère est la modalité qui a l'effectif le plus élevé.
C'est la valeur qui a la plus grande fréquence.
Dans le cas où les modalités sont des classes, on parle de classe modale et on prend comme mode le centre de cette classe modale.
Remarque
Le mode est facile à déterminer et d'interprétation rapide, mais il n'est pas souvent unique et n'existe même pas parfois.
b. La médiane
C'est toute valeur qui partage la série statistique ordonnée en deux séries de même effectif.
Exemple $1$ (Cas discret)
Soit la série de données : $4-4-5-6-6-7-8-8-9-9-10$ la médiane est $7$
Exemple $2$ (Cas discret) Soit la séries de données : $4-4-5-6-6-7-8-8-9-9-10-12$
On admet que la médiane est égale à : $\dfrac{7+8}{2}=7.5$
Exemple $3$ (cas où on a des classes)
On donne le tableau suivant
$\begin{array}{|c|c|c|c|c|c|c|c|} \hline\text{Classes }&[2\ ;\ 4[&[4\ ;\ 6[&[6\ ;\ 10[&[10\ ;\ 14[&[14\ ;\ 20[&[20\ ;\ 25[&\text{Total}\\ \hline \text{Effectifs }&10&12&32&40&60&26&180\\ \hline E.C.C&10&22&54&94&154&180&\\ \hline \end{array}$
Déterminer la médiane suivant la méthode par interpolation affine et la méthode graphique.
Dans le polygone des effectifs cumulés croissants, la médiane est l'abscisse du point $N$ d'ordonnée $\dfrac{N}{2}$
Dans l'exemple ci-dessus, $\dfrac{N}{2}$ est égal à $90$
Méthode par interpolation affine
Pour trouver la médiane, on repère d'abord l'intervalle médian. L'intervalle médian est le premier intervalle dont l'effectif cumulé croissant est au moins égal $\dfrac{N}{2}$
On applique la formule
$\dfrac{Me-a_{m}}{\dfrac{N}{2}-N_{m-1}}=\dfrac{b_{m}-a_{m}}{N_{m-1}}$ pour déterminer la médiane $Me$ où :
$\left[a_{m}\ ;\ b_{m}\right[$ est l'intervalle médian ; $N_{m-i}$ l'effectif cumulé croissant de la classe $[a_{m-i}\ ;\ b_{m-i}[$
Dans l'exemple ci-dessous, l'intervalle médian
est $[10\ ;\ 14[$, en appliquant la formule on a
$\dfrac{Me-10}{90-54}=\dfrac{14-10}{94-54}$ D'où $Me=13$,
Méthodes graphiques
Elles consistent à déterminer la médiane par simple lecture graphique.
$\bullet\ $Méthode $1$
On trace le polygone des effectifs cumulés croissants ou le polygone des effectifs cumulés décroissants, puis la droite d'équation $y=\dfrac{N}{2}$
L'abscisse du point d'intersection des deux courbes correspond à la médiane.
$\bullet\ $Méthode $2$
On trace le polygone des fréquences cumulées croissantes ou le polygone des fréquences cumulées décroissantes, puis la droite d'équation $y=0.5$
L'abscisse du point d'intersection des deux courbes correspond à la médiane.
$\bullet\ $Méthode $3$
On trace le polygone des effectifs cumulés croissants et le polygone des effectifs cumulés décroissants.
L'abscisse du point d'intersection des deux courbes correspond à la médiane.
$\bullet\ $Méthode $4$
On trace le polygone des fréquences cumulées croissantes et le polygone des fréquences cumulées décroissantes.
L'abscisse du point d'intersection des deux courbes correspond à la médiane.
c. Moyenne arithmétique
Soit $x$ une variable discrète dont les modalités notées dans l'ordre croissant $x_{1}$, $x_{2}$ $\ldots$, $x_{p}$ , sont d'effectifs respectifs
$n_{1}$, $n_{2}$, $n_{3}$, $\ldots$, $n_{p}$ et de fréquences respectives $f_{1}$, $f_{2}$ ,$f_{3}$, $\ldots$, $f_{p}$
La moyenne arithmétique de cette série est le réel noté en général $x$ et défini par la formule
$\overline{x}=\dfrac{1}{N}\Sigma_{\lim_{1}^{p}}n_{i}x_{i}=\sigma_{\lim_{i}^{p}}f_{i}x_{i}$
Dans le cas où les modalités sont des classes : $\overline{x}=\dfrac{1}{N}\Sigma_{\lim_{1}^{p}}c_{i}n_{i}$ où les $c_{i}$ sont les centres des classes
La moyenne est la valeur autour de laquelle tournent toutes les valeurs de la série.
Disponible pratique pour le calcul de la moyenne
$\begin{array}{|c|c|c|c|c|c|c|} \hline x_{i}&4&5&6&7&9&\text{Total }\\ \hline n_{i}&15&5&5&10&20&55\\
\hline n_{i}x_{i}&60&25&30&70&180&360\\ \hline \end{array}$
Remarques
1. Le mode, la médiane et la moyenne sont des paramètres de position.
2. Insuffisance des caractéristiques de position
Soit la série $x$ : $10$ ; $30$ ; $30$ ; $50$ ; $50$ ; $70$ ; $70$ ; $90$ ; $90$
Et la série $y$ : $48$ ; $48$ ; $49$ ; $50$ ; $50$ ; $50$ ; $51$ ; $51$ ; $52$
Ces $2$ séries ont le même mode, la même médiane et la même moyenne pourtant la distribution des valeurs de $y$ est plus étroite que celle de $x.$
Ajouter un commentaire