Statistiques descriptives
Les statistiques descriptives résument un jeu de données par quelques nombres clés : un « centre » (moyenne, médiane) et une « dispersion » (écart-type). Le piège du concours n'est presque jamais le calcul, mais le choix du bon indicateur et la lecture corrected'un tableau de fréquences ou d'un histogramme. Pour un futur médecin, c'est la grammaire de toute analyse de résultats, valeurs de référence, variabilité biologique, interprétation d'une étude.
1Indicateurs de tendance centrale
: on additionne toutes les valeurs et on divise par leur nombre. Sensible aux valeurs extrêmes(une seule valeur énorme la tire vers le haut).
Exemple, série 4, 6, 8, 10, 12 :.
On ordonne les valeurs, puis on prend celle du milieu (la moyenne des deux valeurs centrales si est pair). Moitié des données en dessous, moitié au-dessus. Robuste : insensible aux extrêmes.
Exemple, série ordonnée 4, 6, 8, 10, 12 (5 valeurs) : la médiane est la 3ᵉ valeur, 8. Même si l'on remplace 12 par 1000, la médiane reste 8.
La valeur (ou la classe) qui revient le plus souvent. Une série peut avoir plusieurs modes, et c'est le seul indicateur utilisable pour des données non numériques (groupe sanguin, couleur des yeux…).
Exemple, série 4, 6, 6, 8, 12 : la valeur 6 apparaît deux fois, c'est le mode.
Monte la dernière valeur très haut : la moyenne se fait tirer par cette donnée extrême, tandis que la médiane bouge à peine. C'est pourquoi la médiane est plus « robuste ».
Dans une entreprise, 9 employés gagnent 2 000 € et le patron 50 000 €. Le « salaire moyen » de 6 800 € est-il représentatif ?Réfléchis puis ouvre ▾
2La moyenne pondérée
Un étudiant a 14 à un examen de coefficient 3 et 8 à un examen de coefficient 1. Quelle est sa moyenne ?Intermédiaire
3Effectifs et fréquences
Un tableau de fréquences relatives donne 0,12 ; 0,28 ; 0,25 ; ? ; 0,15. Quelle est la fréquence manquante ?Facile
4La dispersion : écart-type et variance
Deux classes ont la même moyenne de 10/20. Dans l'une tout le monde a entre 9 et 11 ; dans l'autre, moitié a 4 et moitié a 16. Laquelle a le plus grand écart-type ?Réfléchis puis ouvre ▾
Calcule l'écart-type de la série 12, 14, 15, 16, 18.Intermédiaire
5Lire un histogramme
| Élément du graphe | Ce qu'il représente |
|---|---|
| Largeur d'un rectangle | l'amplitude de la classe |
| Aire d'un rectangle | l'effectif (ou la fréquence) de la classe |
| Aire totale | l'effectif total (ou 1 en fréquences) |
Deux classes ont le même effectif, mais l'une est deux fois plus large. Comment sont leurs hauteurs sur un histogramme correct ?Réfléchis puis ouvre ▾
6Effet d'une donnée : robustesse
Comprendre comment une seule valeur fait bouger les indicateurs est une compétence d'examen à part entière.
On retire les deux valeurs les plus extrêmes d'une série. Que devient nécessairement l'écart-type ?Réfléchis puis ouvre ▾
Une série de 5 notes a une moyenne de 12. On ajoute une 6ᵉ note. Quelle doit-elle être pour que la nouvelle moyenne soit 13 ?Niveau concours
7Les erreurs fréquentes
- Calculer la médiane sans ordonner la sérietoujours trier les valeurs par ordre croissant AVANT de prendre la valeur centrale.
- Faire la moyenne des moyennes de groupes inégauxPourquoi : on oublie de pondérer par les effectifsutiliser la moyenne pondérée : Σ(fᵢxᵢ)/Σfᵢ.
- Confondre variance et écart-typel'écart-type a l'unité des données ; la variance est à l'unité au carré (σ = √variance).
- Juger un histogramme à la hauteur des barresà classes inégales, c'est l'AIRE qui donne l'effectif, pas la hauteur.
- Croire qu'une moyenne « représente » toujours bien la sérieavec des extrêmes, préférer la médiane ; toujours regarder aussi la dispersion.
- Oublier que Σ des fréquences relatives = 1une fréquence manquante se déduit par complément à 1 (ou à 100 %).
- Affirmer qu'enlever des extrêmes baisse forcément σcela dépend des données : σ peut baisser, augmenter ou rester stable.
- Moyenne = centre de gravité (sensible aux extrêmes) ; médiane = valeur centrale (robuste) ; mode = la plus fréquente.
- Groupes d'effectifs inégaux ⇒ moyenne pondérée .
- Somme des fréquences relatives = 1 ; une fréquence manquante se trouve par complément.
- Dispersion : variance , écart-type (unité des données).
- Histogramme à classes inégales : l'aire (pas la hauteur) donne l'effectif.
- Règle 68 / 95 : ≈ 68 % des données à , ≈ 95 % à (valeurs de référence).
- Penser en sommes (n × moyenne) pour les questions « quelle note pour atteindre… ».
Passe à l'entraînement réel sur ce chapitre
Teste-toi sur 20 questions type examen et obtiens une analyse de tes faiblesses.