Calculateur de valeur p

Une valeur p mesure la probabilité d'obtenir des résultats aussi extrêmes que les données observées, en supposant que l'hypothèse nulle est vraie. Saisissez un z-score ou des statistiques d'échantillon (moyenne, moyenne de la population, écart-type, taille d'échantillon) pour calculer instantanément la valeur p et déterminer la signification statistique.

Mode de saisie

Type de test

Niveau de signification (α)

Z-score

p = 2 × (1 − Φ(|z|))

Calculateurs associés

Calculateur de test A/B Calculateur de taille d'échantillon pour test A/B Calculateur de résumé à cinq nombres Calculateur de taux de conversion

Questions fréquentes

Qu'est-ce qu'une valeur p ?

Une valeur p est la probabilité d'obtenir des résultats de test au moins aussi extrêmes que les résultats observés, en supposant que l'hypothèse nulle est vraie. Une petite valeur p (généralement < 0.05) suggère que les données observées sont peu probables sous l'hypothèse nulle, ce qui fournit des éléments pour la rejeter.

Comment calculer une valeur p à partir d'un z-score ?

Pour un test bilatéral : p = 2 × (1 − Φ(|Z|)), où Φ est la fonction de répartition de la loi normale standard. Pour un test unilatéral à gauche : p = Φ(Z). Pour un test unilatéral à droite : p = 1 − Φ(Z). Si vous utilisez des statistiques d'échantillon, le z-score se calcule avec Z = (x̄ − μ₀) / (σ / √n).

Que signifie p < 0.05 ?

Lorsque p < 0.05, le résultat est statistiquement significatif au niveau de signification de 5 % (niveau de confiance de 95 %). Cela signifie que, si l'hypothèse nulle était vraie, la probabilité d'observer par hasard des données aussi extrêmes serait inférieure à 5 %. Vous pouvez rejeter l'hypothèse nulle.

Dois-je utiliser un test unilatéral ou bilatéral ?

Utilisez un test bilatéral lorsque vous supposez que la moyenne peut différer dans les deux sens (H₁: μ ≠ μ₀). Utilisez un test unilatéral uniquement si vous avez une raison préalable solide d'attendre une direction précise : à gauche (H₁: μ < μ₀) ou à droite (H₁: μ > μ₀). Le type de test doit être choisi avant la collecte des données.

Quel niveau de signification (alpha) choisir ?

α = 0.05 est le standard conventionnel pour la plupart des recherches. Utilisez α = 0.10 pour les études exploratoires où un certain nombre de faux positifs est acceptable. Utilisez α = 0.01 ou moins pour les décisions à fort enjeu (essais médicaux, décisions de politique publique), où les faux positifs peuvent coûter très cher.

Quelle est la différence entre une valeur p et un intervalle de confiance ?

Une valeur p donne une décision de type oui/non sur la signification statistique pour un alpha donné. Un intervalle de confiance fournit une plage de valeurs plausibles pour l'effet réel et exprime directement l'incertitude. Les deux sont complémentaires : un intervalle de confiance à 95 % qui exclut zéro correspond à une valeur p bilatérale < 0.05.

Une valeur p peut-elle me donner la probabilité que l'hypothèse nulle soit vraie ?

Non : c'est une idée reçue fréquente. La valeur p est la probabilité des données observées (ou de données plus extrêmes) sachant que l'hypothèse nulle est vraie. Ce n'est PAS la probabilité que l'hypothèse nulle elle-même soit vraie. Pour estimer cela, il faudrait utiliser des méthodes bayésiennes.

Quelle est la différence entre un test z et un test t ?

Un test z convient lorsque l'écart-type de la population (σ) est connu et que la taille d'échantillon est grande (n ≥ 30). Un test t s'utilise lorsque σ est inconnu et doit être estimé à partir de l'échantillon, ce qui est fréquent avec les petits échantillons. Pour les grands échantillons, les résultats des tests t et z convergent.

Qu'est-ce qu'une valeur p ?

Une valeur p (valeur de probabilité) est la probabilité d'obtenir des résultats de test au moins aussi extrêmes que les résultats observés, en supposant que l'hypothèse nulle est vraie. Autrement dit, la valeur p répond à la question : si aucun effet réel n'existait, quelle serait la probabilité d'observer par hasard des données aussi extrêmes ?

Une petite valeur p (généralement < 0.05) suggère que les données observées sont peu probables sous l'hypothèse nulle, ce qui fournit des éléments pour la rejeter. Une grande valeur p signifie que les données sont compatibles avec l'hypothèse nulle : on ne la rejette donc pas.

Les valeurs p sont fondamentales dans les tests d'hypothèse en statistique, médecine, psychologie, économie et science des données. Elles ne mesurent pas la probabilité que l'hypothèse nulle soit vraie : elles mesurent la probabilité des données observées sachant que l'hypothèse nulle est vraie.

Formule de la valeur p à partir d'un z-score

Ce calculateur calcule les valeurs p avec la loi normale standard (test z). Le z-score mesure de combien d'erreurs standard la moyenne de l'échantillon s'éloigne de la moyenne de la population :

Z-score à partir des statistiques d'échantillon
Z = (x̄ − μ₀) / (σ / √n)

Où : x̄ = moyenne de l'échantillon | μ₀ = moyenne de la population | σ = écart-type | n = taille d'échantillon

Valeur p bilatérale
p = 2 × (1 − Φ(|Z|))

Valeur p unilatérale à gauche
p = Φ(Z)

Valeur p unilatérale à droite
p = 1 − Φ(Z)

Où Φ(Z) est la fonction de répartition (CDF) de la loi normale standard. Le calculateur utilise l'approximation d'Abramowitz & Stegun (formule 7.1.26) pour évaluer la fonction de répartition rapidement et précisément.

Niveaux de signification courants (α)

Le niveau de signification (alpha, α) est le seuil en dessous duquel vous rejetez l'hypothèse nulle. Choisir α avant de collecter les données est essentiel pour éviter la manipulation des valeurs p.

Alpha (α)	Niveau de confiance	Z critique (bilatéral)	Utilisation typique
0.10	90%	±1.645	Recherche exploratoire, décisions à faible enjeu
0.05	95%	±1.960	Référence courante, la plupart des tests d'hypothèse
0.01	99%	±2.576	Essais médicaux, recherches à fort enjeu
0.001	99.9%	±3.291	Physique (découverte de particules), études pangénomiques

Un résultat est statistiquement significatif lorsque p < α. Avec α = 0.05, vous acceptez un risque de 5 % de faux positif (erreur de type I), c'est-à-dire de rejeter à tort une hypothèse nulle vraie.

Tests unilatéraux et bilatéraux

Le choix entre un test unilatéral et un test bilatéral dépend de votre hypothèse avant d'observer les données.

Test bilatéral

H₀: μ = μ₀ H₁: μ ≠ μ₀

À utiliser lorsque vous testez si la moyenne est différente de la moyenne de la population, dans un sens ou dans l'autre. C'est le choix le plus courant et le plus conservateur.

Test unilatéral à gauche

H₀: μ ≥ μ₀ H₁: μ < μ₀

À utiliser lorsque vous supposez précisément que la moyenne est inférieure à la valeur de population. La région de rejet se situe dans la queue gauche.

Test unilatéral à droite

H₀: μ ≤ μ₀ H₁: μ > μ₀

À utiliser lorsque vous supposez précisément que la moyenne est supérieure à la valeur de population. La région de rejet se situe dans la queue droite.

Une valeur p bilatérale est exactement le double de la valeur p unilatérale correspondante pour le même z-score. Choisir un test unilatéral après avoir vu que les résultats vont dans la direction attendue relève de la manipulation des valeurs p et augmente le taux de faux positifs.

Exemples de calcul de valeur p

Exemple 1 : Test z bilatéral (significatif)

Un chercheur teste si un nouveau médicament modifie la tension artérielle. Il observe z = 2.50 avec α = 0.05 (bilatéral).

Z = 2.50
p = 2 × (1 − Φ(2.50)) = 2 × 0.00621 = 0.0124
p (0.0124) < α (0.05)
Résultat : statistiquement significatif - rejeter H₀

Exemple 2 : À partir des statistiques d'échantillon

Contrôle qualité : moyenne de l'échantillon = 105, moyenne de la population = 100, σ = 15, n = 36 (bilatéral, α = 0.05).

SE = 15 / √36 = 2.5
Z = (105 − 100) / 2.5 = 2.0
p = 2 × (1 − Φ(2.0)) ≈ 0.0455
p (0.0455) < α (0.05)
Résultat : statistiquement significatif - l'échantillon diffère de la moyenne de la population

Exemple 3 : Test unilatéral à droite (non significatif)

On teste si une nouvelle méthode d'enseignement améliore les notes. Z = 1.20, α = 0.05 (unilatéral à droite).

Z = 1.20
p = 1 − Φ(1.20) ≈ 0.1151
p (0.1151) ≥ α (0.05)
Résultat : non significatif - ne pas rejeter H₀

Erreurs fréquentes avec les valeurs p

Mal interpréter la valeur p - Une valeur p n'est PAS la probabilité que l'hypothèse nulle soit vraie. C'est la probabilité des données observées en supposant que l'hypothèse nulle est vraie.
Manipuler les valeurs p - Réaliser plusieurs tests et ne rapporter que ceux qui sont significatifs gonfle le taux de faux positifs. Préenregistrez votre hypothèse et votre méthode de correction.
Passer d'un test bilatéral à un test unilatéral après avoir vu les résultats divise la valeur p par deux et constitue une forme de manipulation des valeurs p.
Confondre signification statistique et importance pratique - Une très petite valeur p avec un grand échantillon peut correspondre à un effet trivialement faible. Vérifiez toujours la taille d'effet.
Ignorer les conditions d'application - Les tests z supposent que l'écart-type de la population est connu et que les données sont approximativement normales. Utilisez un test t pour les petits échantillons lorsque σ est inconnu.
Traiter p = 0.049 et p = 0.051 comme radicalement différents - Le seuil de 0.05 est une convention, pas une règle absolue. Rapportez les valeurs p observées et les intervalles de confiance.

Outils associés

Calculateur de test A/B - Test z à deux proportions pour les expériences A/B.
Calculateur de taille d'échantillon pour test A/B - Déterminer la taille d'échantillon requise avant le test.
Calculateur de résumé à cinq nombres - Minimum, Q1, médiane, Q3, maximum et écart-type.
Calculateur de taux de conversion - Calculer et comparer les taux de conversion.