Question 1

Qu'est-ce qu'un test du khi-deux ?

Accepted Answer

Un test du khi-deux est un test d'hypothèse statistique qui évalue si les fréquences observées diffèrent significativement des fréquences attendues. Il s'applique aux données catégorielles et existe sous deux formes principales : le test d'ajustement (une variable catégorielle comparée à une distribution attendue) et le test d'indépendance (deux variables catégorielles dans un tableau de contingence).

Question 2

Comment calcule-t-on la statistique du khi-deux ?

Accepted Answer

La statistique du khi-deux se calcule ainsi : χ² = Σ (O − E)² / E, où O est la fréquence observée et E la fréquence attendue pour chaque catégorie ou cellule. Additionnez cette valeur sur toutes les catégories ou cellules pour obtenir la statistique χ² totale.

Question 3

Quelle est la différence entre le test d'ajustement et le test d'indépendance ?

Accepted Answer

Le test d'ajustement vérifie si un seul ensemble d'effectifs observés correspond à une distribution attendue précise (par exemple, un dé est-il équilibré ?). Le test d'indépendance utilise un tableau de contingence pour déterminer si deux variables catégorielles sont liées (par exemple, le genre influence-t-il la préférence pour un produit ?). La formule des degrés de liberté diffère : k − 1 pour l'ajustement, (lignes − 1) × (colonnes − 1) pour l'indépendance.

Question 4

Que sont les degrés de liberté dans un test du khi-deux ?

Accepted Answer

Les degrés de liberté (df) déterminent quelle distribution du khi-deux utiliser. Pour un test d'ajustement, df = k − 1 (k = nombre de catégories). Pour un test d'indépendance, df = (lignes − 1) × (colonnes − 1). Par exemple, un tableau de contingence 3×4 a df = (3−1)×(4−1) = 6.

Question 5

Quelle valeur p est statistiquement significative pour un test du khi-deux ?

Accepted Answer

Le seuil de signification standard est α = 0,05. Si la valeur p est inférieure à 0,05, le résultat est statistiquement significatif et l'hypothèse nulle est rejetée. Vous pouvez aussi utiliser α = 0,10 pour une analyse exploratoire ou α = 0,01 pour des critères plus stricts. La valeur p représente la probabilité d'observer une valeur χ² aussi grande ou plus grande si l'hypothèse nulle était vraie.

Question 6

Quelle est la fréquence attendue minimale pour un test du khi-deux ?

Accepted Answer

L'approximation du khi-deux est fiable lorsque toutes les fréquences attendues des cellules sont au moins égales à 5. Si certaines cellules ont des fréquences attendues inférieures à 5, envisagez de regrouper des catégories, de collecter davantage de données ou d'utiliser le test exact de Fisher (pour les tableaux 2×2). Des fréquences attendues très faibles peuvent gonfler la statistique χ² et produire des valeurs p faussement petites.

Question 7

Comment interpréter les contributions par cellule ?

Accepted Answer

La contribution de chaque cellule à χ² est (O − E)² / E. Les grandes contributions indiquent les cellules où les effectifs observés s'écartent le plus des effectifs attendus. Examiner les contributions individuelles aide à repérer les catégories ou combinaisons de variables qui expliquent l'association globale. Une contribution supérieure à 3,84 (df = 1 à α = 0,05) dans une seule cellule suggère un écart particulièrement important.

Question 8

Peut-on utiliser le test du khi-deux pour des données continues ?

Accepted Answer

Non. Les tests du khi-deux s'appliquent uniquement aux données de comptage (fréquences de variables catégorielles). Pour des données continues, utilisez des tests t (comparaison de deux moyennes), une ANOVA (comparaison de plusieurs moyennes de groupes) ou une corrélation de Pearson/Spearman (mesure de l'association entre variables continues). Pour utiliser le khi-deux avec des données continues, il faut d'abord regrouper les valeurs en catégories.

Élément	Test d'ajustement	Test d'indépendance
Question	La distribution correspond-elle à une distribution attendue précise ?	Deux variables catégorielles sont-elles indépendantes ?
Entrée	Un ensemble de fréquences observées + un ensemble de fréquences attendues	Tableau de contingence 2D (lignes × colonnes)
Formule de df	k − 1 (k = nombre de catégories)	(lignes − 1) × (colonnes − 1)
Exemple	Un dé est-il équilibré ? Des données d'enquête suivent-elles une distribution connue ?	Le tabagisme est-il lié à une maladie pulmonaire ? Le genre influence-t-il une préférence ?

df	α = 0.10	α = 0.05	α = 0.025	α = 0.01
1	2.706	3.841	5.024	6.635
2	4.605	5.991	7.378	9.210
3	6.251	7.815	9.348	11.345
4	7.779	9.488	11.143	13.277
5	9.236	11.070	12.832	15.086
6	10.645	12.592	14.449	16.812
8	13.362	15.507	17.535	20.090
10	15.987	18.307	20.483	23.209
15	22.307	24.996	27.488	30.578
20	28.412	31.410	34.170	37.566

Calculateur du khi-deux

Calculateurs associés

Questions fréquentes

Qu'est-ce qu'un test du khi-deux ?

Comment calcule-t-on la statistique du khi-deux ?

Quelle est la différence entre le test d'ajustement et le test d'indépendance ?

Que sont les degrés de liberté dans un test du khi-deux ?

Quelle valeur p est statistiquement significative pour un test du khi-deux ?

Quelle est la fréquence attendue minimale pour un test du khi-deux ?

Comment interpréter les contributions par cellule ?

Peut-on utiliser le test du khi-deux pour des données continues ?

Formule du khi-deux

Test d'ajustement ou test d'indépendance

Test d'ajustement

Test d'indépendance

Degrés de liberté

Tableau des valeurs critiques du khi-deux

Exemples de calcul du khi-deux

Exemple 1 : test d'ajustement — dé équilibré

Exemple 2 : test d'indépendance — genre et préférence

Hypothèses et limites