Question 1

Comment calculer la taille d'échantillon d'un test A/B ?

Accepted Answer

La taille d'échantillon se calcule avec la formule : n = (Zα/2 + Zβ)² × (p₁(1-p₁) + p₂(1-p₂)) / (p₂-p₁)², où p₁ est le taux de conversion de référence, p₂ le taux amélioré attendu, Zα/2 la valeur z correspondant à votre niveau de confiance, et Zβ la valeur z correspondant à la puissance souhaitée.

Question 2

Qu'est-ce que l'effet minimal détectable (MDE) ?

Accepted Answer

Le MDE est la plus petite amélioration relative que vous voulez pouvoir détecter dans votre test. Un MDE de 10 % sur une référence de 5 % signifie que vous voulez détecter si la variante atteint au moins 5,5 % (soit une amélioration absolue de 0,5 point de pourcentage). Des MDE plus faibles exigent des tailles d'échantillon plus grandes.

Question 3

Qu'est-ce que la puissance statistique ?

Accepted Answer

La puissance statistique (1-β) est la probabilité de détecter correctement un effet réel. Une puissance de 80 % signifie que vous avez 80 % de chances de détecter une vraie différence et 20 % de chances de la manquer (erreur de type II). Une puissance plus élevée nécessite plus d'échantillons, mais réduit les faux négatifs.

Question 4

Pourquoi ai-je besoin d'autant de visiteurs pour mon test A/B ?

Accepted Answer

La taille d'échantillon dépend de votre taux de référence, du MDE souhaité, du niveau de confiance et de la puissance. Des taux de référence plus bas, des MDE plus petits, une confiance plus élevée et une puissance plus élevée augmentent tous la taille d'échantillon requise. Une référence de 5 % avec un MDE relatif de 5 %, à 95 % de confiance et 80 % de puissance, nécessite environ 125 000 visiteurs par variante.

Question 5

Combien de temps dois-je faire durer mon test A/B ?

Accepted Answer

Divisez la taille totale d'échantillon requise par votre trafic quotidien. Par exemple, si vous avez besoin de 20 000 visiteurs au total et recevez 2 000 visiteurs par jour, faites durer le test au moins 10 jours. Prévoyez aussi au minimum 1 à 2 semaines complètes pour tenir compte des variations de comportement selon le jour de la semaine.

Question 6

Quel niveau de confiance et quelle puissance dois-je utiliser ?

Accepted Answer

Le standard est 95 % de confiance et 80 % de puissance. Utilisez 90 % de confiance pour des itérations plus rapides lorsque les faux positifs coûtent moins cher. Utilisez 99 % de confiance pour les changements à fort impact. Augmentez la puissance à 90-95 % lorsqu'il serait très coûteux de manquer une amélioration réelle (par exemple, pour des tests de prix).

Question 7

Puis-je réduire la taille d'échantillon requise ?

Accepted Answer

Oui : (1) Acceptez un MDE plus grand — si seules les grandes améliorations vous intéressent, vous avez besoin de moins d'échantillons. (2) Abaissez la confiance à 90 %. (3) Abaissez la puissance à 70-80 %. (4) Utilisez des tests unilatéraux si seules les améliorations vous intéressent (déconseillé dans la plupart des cas). (5) Concentrez le trafic sur les pages testées.

Question 8

Que se passe-t-il si j'arrête mon test trop tôt ?

Accepted Answer

Arrêter le test trop tôt lorsque vous voyez un résultat significatif gonfle fortement les taux de faux positifs, un phénomène lié à la consultation répétée des résultats. Vous pouvez conclure qu'une variante est meilleure alors qu'elle ne l'est pas. Engagez-vous toujours à atteindre la taille d'échantillon calculée à l'avance avant d'analyser les résultats, ou utilisez des méthodes de test séquentiel conçues pour le suivi continu.

Taux de référence	MDE de 5 %	MDE de 10 %	MDE de 20 %
1%	637,008	163,092	42,691
3%	207,936	53,208	13,911
5%	122,121	31,231	8,155
10%	57,760	14,749	3,839
20%	25,580	6,507	1,680

Type d'erreur	Nom	Contrôlé par	Conséquence
Type I (α)	Faux positif	Niveau de confiance	Déployer un changement qui ne fonctionne pas
Type II (β)	Faux négatif	Puissance statistique	Manquer une amélioration réelle

Calculateur de taille d'échantillon pour test A/B

Référence rapide de taille d'échantillon

Calculateurs associés

Questions fréquentes

Comment calculer la taille d'échantillon d'un test A/B ?

Qu'est-ce que l'effet minimal détectable (MDE) ?

Qu'est-ce que la puissance statistique ?

Pourquoi ai-je besoin d'autant de visiteurs pour mon test A/B ?

Combien de temps dois-je faire durer mon test A/B ?

Quel niveau de confiance et quelle puissance dois-je utiliser ?

Puis-je réduire la taille d'échantillon requise ?

Que se passe-t-il si j'arrête mon test trop tôt ?

Calculateur de taille d'échantillon pour test A/B : guide complet

Navigation rapide

Pourquoi la taille d'échantillon compte dans les tests A/B

Formule de taille d'échantillon

Exemples de calcul de taille d'échantillon

Exemple 1 : test e-commerce standard

Exemple 2 : page d'atterrissage à forte conversion

Exemple 3 : changement ambitieux, faible trafic

Comprendre les paramètres clés

Taux de conversion de référence

Effet minimal détectable (MDE)

Niveau de confiance (1 - α)

Puissance statistique (1 - β)

Comment réduire la taille d'échantillon requise

Pièges courants dans la planification de la taille d'échantillon