置信区间计算器

置信区间(CI)是从样本数据计算得出的数值范围,可能包含真实总体参数。输入样本均值、标准差和样本量——或您的比例数据——即时计算 90%、95% 或 99% 置信区间,含误差范围和标准误差。

CI = x̄ ± z* × (σ / √n)

常见问题

什么是置信区间?

置信区间(CI)是一个可能以特定概率包含真实总体参数的数值范围。例如,95% 置信区间 [48, 52] 意味着如果多次重复研究,95% 的这类区间会包含真实总体均值。这并非说明真实值有 95% 的概率在此特定区间内。

如何计算均值的 95% 置信区间?

计算均值的 95% CI:(1) 计算标准误差:SE = σ / √n;(2) 乘以 z 分数:MOE = 1.960 × SE;(3) 加减样本均值:CI = [x̄ − MOE, x̄ + MOE]。例如,x̄ = 50,σ = 10,n = 100:SE = 1,MOE = 1.96,CI = [48.04, 51.96]。

90%、95% 和 99% 置信区间有什么区别?

置信水平越高,区间越宽。90% CI 使用 z* = 1.645,95% CI 使用 z* = 1.960,99% CI 使用 z* = 2.576。95% 水平是大多数研究的行业标准。在速度比确定性更重要时使用 90%,在高风险决策中假阳性代价很高时使用 99%。

什么是误差边距?

误差边距(MOE)是置信区间宽度的一半。它代表在给定置信水平下,样本估计值与真实总体值之间的最大预期差异。MOE = z* × SE = z* × (σ / √n)。对于民调,典型的 1,000 人调查在 95% 置信度下误差边距约为 ±3%。

样本量如何影响置信区间?

样本量越大,置信区间越窄(越精确)。标准误差为 σ/√n,因此 CI 宽度按 1/√n 的比例缩小。样本量翻倍,CI 宽度约减少 29%。要将误差边距减半,需要将样本量扩大四倍。

如何计算比例的置信区间?

对于比例(Wald 方法):(1) 计算 p̂ = 成功次数 / n;(2) 计算 SE = √(p̂(1 − p̂) / n);(3) 应用 MOE = z* × SE;(4) CI = [p̂ − MOE, p̂ + MOE],截断至 [0, 1]。例如,200 次中 60 次成功,p̂ = 30%,95% CI 约为 [23.65%, 36.35%]。

什么是标准误差,它与标准差有何不同?

标准差(σ)衡量单个数据点围绕均值的离散程度。标准误差(SE)衡量样本均值作为总体均值估计的精确度。SE = σ / √n。随着样本量增加,标准误差减小,即使标准差保持不变,因为更大的样本提供更精确的估计。

何时应使用置信区间而非假设检验?

置信区间和假设检验密切相关,通常传达相同的信息。当你想估计参数的合理范围时,使用置信区间。当你想要二元决策(拒绝/无法拒绝)时,使用假设检验。如果差异的 95% CI 不包含零,则对应的 α = 0.05 假设检验将拒绝零假设。CI 在研究中通常更受欢迎,因为它同时传达效应大小和不确定性。

什么是置信区间?

**置信区间(CI)**是从样本数据计算得出、以指定概率包含真实总体参数的数值范围。与单点估计(如样本均值)不同,置信区间通过给出合理范围来反映统计估计中固有的不确定性。

例如,95% 置信区间 [48, 52] 的含义是:如果多次重复研究并每次计算置信区间,大约 95% 的区间会包含真实总体均值。这并不意味着真实均值有 95% 的概率在这一特定区间内——一旦计算完成,该区间要么包含真实值,要么不包含。

置信区间广泛应用于科学研究、临床试验、调查统计、质量控制和数据分析,用于表达估计值的精确程度。

置信区间公式

均值的置信区间(已知总体标准差)

当已知总体标准差(σ)或样本量较大(n ≥ 30)时,使用 z 分布:

第 1 步:计算标准误差

SE = σ / √n

其中 σ = 标准差,n = 样本量

第 2 步:计算边际误差

MOE = z × SE

其中 z = 标准正态分布对应的临界值

第 3 步:计算置信区间上下限

CI = x̄ ± MOE
下限 = x̄ − MOE
上限 = x̄ + MOE

计算示例

样本均值 x̄ = 50,标准差 σ = 10,样本量 n = 100,置信水平 = 95%:

SE = 10 / √100 = 10 / 10 = 1.000
z (95%) = 1.960
MOE = 1.960 × 1.000 = 1.960
下限 = 50 − 1.960 = 48.040
上限 = 50 + 1.960 = 51.960
95% CI = [48.040, 51.960]

z 临界值表

临界 z 值(z*)对应于置信水平,是从均值出发、覆盖正态分布中心区域等于置信水平面积所需的标准误差倍数。

置信水平显著性水平(α)α/2z 临界值(z*)
80%0.200.101.282
85%0.150.0751.440
90%0.100.051.645
95% ★0.050.0251.960
99%0.010.0052.576
99.9%0.0010.00053.291

★ 大多数研究的行业标准

如何解读置信区间

正确解读置信区间是统计学中最重要、也最容易被误解的技能之一。

正确解读

95% 置信区间的含义是:如果多次重复抽样并每次构建置信区间,大约 95% 的区间会包含真实总体参数。

常见误解

  • 错误:"真实均值有 95% 的概率在 [48, 52] 内。"——真实均值是固定值,它要么在区间内,要么不在。
  • 错误:"95% 的数据落在此范围内。"——那是预测区间的含义,不是置信区间。
  • 正确:"我使用了一种方法,该方法生成的区间有 95% 的概率包含真实参数。"

实用指导

  • 区间越窄,精确度越高(样本量 n 越大或标准差 σ 越小)
  • 区间越宽,不确定性越大(样本量 n 越小或标准差 σ 越大)
  • 如果差值的置信区间不包含零,则该差异在统计上显著
  • 置信水平越高,区间越宽

理解边际误差

**边际误差(MOE)**是置信区间宽度的一半,表示在给定置信水平下,样本估计值与真实总体值之间的最大预期差异。

边际误差的计算公式为:

MOE = z* × (σ / √n)

减小边际误差的因素:

  • 增大样本量(n)——边际误差与 1/√n 成比例减小
  • 减小总体变异性(σ)——总体越均匀,区间越窄
  • 降低置信水平——以确定性换取精确性

在民调中,1,000 人调查在 95% 置信度下典型的边际误差约为 ±3%。要将边际误差减半,样本量需要扩大四倍

样本量如何影响置信区间

样本量对置信区间宽度有显著影响。由于标准误差公式为 σ/√n,样本量翻倍可将标准误差减少约 29%(√2 ≈ 1.414 倍)。

样本量(n)标准误差(σ=10)边际误差 @ 95%95% 置信区间宽度
252.0003.9207.840
1001.0001.9603.920
4000.5000.9801.960
1,0000.3160.6201.240

从 n=25 增加到 n=100(扩大 4 倍)可将置信区间宽度减半。边际收益递减意味着,进一步增大样本量对精确度的提升有限,但代价高昂。

比例的置信区间

在估计总体比例时(例如,支持某候选人的选民比例,或生产中的缺陷率),由于标准误差本身依赖于比例值,公式略有不同。

比例置信区间公式(Wald 方法)

p̂ = 成功次数 / n
SE = √(p̂(1 − p̂) / n)
CI = p̂ ± z* × SE

计算示例

在 200 人调查中,60 人偏好产品 A。真实比例的 95% 置信区间是多少?

p̂ = 60 / 200 = 0.30(30%)
SE = √(0.30 × 0.70 / 200) = √(0.00105) ≈ 0.03240
MOE = 1.960 × 0.03240 ≈ 0.06350
下限 = 0.30 − 0.0635 = 23.65%
上限 = 0.30 + 0.0635 = 36.35%
95% CI = [23.65%, 36.35%]

**注意:**置信区间上下限被截断在 [0, 1] 范围内,因为比例不能为负数或超过 100%。对于接近 0 或 1 的比例,建议使用 Wilson 得分区间以获得更好的覆盖率。

相关工具