样本量计算器
确定需要多少调查受访者或研究参与者。输入所需置信水平、误差范围和(可选)总体数量,计算统计有效结果所需的最小样本量。
n = Z² × p(1-p) / e²
其中 Z = z 值,p = 比例,e = 误差范围
Z = 1.960 — 大多数研究的标准值
未知时使用 50%——这会给出最大(最保守)的样本量。
样本量快速参考
在 95% 置信水平、p = 50% 时所需样本量:
| 误差范围 | 无限总体 | 总体 1 万 | 总体 1 千 |
|---|---|---|---|
| ±1% | 9,604 | 4,900 | 906 |
| ±2% | 2,401 | 1,937 | 707 |
| ±3% | 1,068 | 965 | 517 |
| ±5% | 385 | 370 | 278 |
| ±10% | 97 | 96 | 88 |
* 有限总体校正会在总体较小时降低所需样本量。
常见问题
如何计算调查所需的样本量?
使用公式 n = Z² × p × (1-p) / e²,其中 Z 是置信水平对应的 Z 值(95% 时为 1.96),p 是预期比例(未知时取 0.5),e 是期望的误差幅度(以小数表示)。例如,95% 置信水平、±5% 误差、p = 0.5 时:n = (1.96)² × 0.25 / (0.05)² = 384.16 → 385 名受访者。
调查中的误差幅度是什么?
误差幅度(也称为置信区间半宽)是样本结果与总体真实值之间的最大预期差异。±5% 的误差幅度意味着调查结果与真实答案相差不超过 5 个百分点。误差幅度越小,所需样本量越大。
我的调查应该使用什么置信水平?
大多数商业和社会科学研究的标准是 95% 置信水平。高风险决策(医学试验、金融研究、法律事务)使用 99%。探索性或试点研究在速度和成本比精度更重要时使用 90%。提高置信水平会显著增加所需样本量。
不知道总体比例时应该用什么值?
当真实比例未知时,使用 p = 0.5(50%)。这给出最保守(最大)的样本量估计,确保无论实际比例如何,研究都有足够的统计效力。如果历史数据或试点研究建议不同的值,使用该估计将减少所需样本量。
什么是有限总体校正(FPC)?
有限总体校正在总体规模相对于估计样本较小时减少所需样本量。公式为:n_校正 = n₀ / (1 + (n₀ - 1) / N),其中 N 是总体大小。当样本占总体 5% 以上时,有限总体校正效果最显著。对于 1,000 人的总体,标准 385 人样本经校正后降至约 278 人。
样本量如何影响精度?
样本量越大,误差幅度越小,估计越精确。但这不是线性关系——精度随样本量的平方根提升。将样本量翻倍只能将误差幅度降低约 30%,而不是 50%。增加小样本的收益最大:受访者从 100 增加到 400,误差幅度减半。
调查的最小样本量是多少?
没有通用的最小值,但通用准则建议:基础分析至少 30 名受访者,简单描述性统计至少 100 名,95% 置信水平 ±5% 误差的全国性代表性调查至少 385 名。对于子组分析(年龄组、地区等),每个子组最好至少有 100 名受访者。
更大的总体是否需要更大的样本量?
大多数情况下不是——对于大型总体(10 万以上),无论总体大小,所需样本量几乎相同。对 10 万人城市和 3 亿人国家的调查大约需要相同的样本(±5%、95% 置信区间约 385 人)。总体大小只有在通过有限总体校正处理约 1 万人以下的小总体时,才会显著减少所需样本量。
样本量公式
用于估计总体比例的标准样本量公式源自正态分布。对于无限(或非常大的)总体:
n = Z² × p × (1 - p) / e²
其中:
- n — 所需样本量
- Z — 所需置信水平对应的 Z 值(如 95% 对应 1.960,90% 对应 1.645,99% 对应 2.576)
- p — 预期比例(未知时使用 0.5——使样本量最大)
- e — 以小数表示的误差范围(如 ±5% 对应 0.05)
| 置信水平 | Z 值 | 常见用途 |
|---|---|---|
| 80% | 1.282 | 探索性研究、快速估计 |
| 85% | 1.440 | 初步研究 |
| 90% | 1.645 | 市场调研、非关键决策 |
| 95% | 1.960 | 标准社会科学和商业研究 |
| 99% | 2.576 | 医学研究、高风险决策 |
有限总体校正
当总体规模相对于所需样本不是很大时,标准公式会高估所需样本量。有限总体校正(FPC)对此进行调整:
nₐ = n₀ / (1 + (n₀ - 1) / N)
其中 n₀ = 无限总体估计值,N = 总体大小。
当样本占总体 5% 以上时,有限总体校正效果显著。例如,从 1,000 人的总体中抽取 385 人(抽样比例 38.5%),校正后样本量降至约 278 人——减少了 28%。
示例:
n₀ = 385(95% 置信区间,±5%,p = 0.5,无限总体)
N = 1,000
nₐ = 385 / (1 + (385 - 1) / 1,000)
nₐ ≈ 278 名受访者
如果不知道总体大小,或总体非常大(如全国性调查),请将总体字段留空。此时将使用标准公式。
选择误差范围
误差范围(MoE),也称为置信区间半宽,定义了样本估计值与总体真实值的接近程度。±5% 的误差范围意味着结果与实际答案相差不超过 5 个百分点。
按研究类型的参考准则
| 研究类型 | 推荐误差范围 | 理由 |
|---|---|---|
| 全国性民调、政治调查 | ±2–3% | 竞争激烈时需要精确结果 |
| 客户满意度调查 | ±5% | 商业决策的行业标准 |
| 市场调研、内部调查 | ±5–10% | 趋势检测、方向性洞察 |
| 探索性 / 试点研究 | ±10% | 在正式研究前快速低成本筛查 |
| 学术 / 临床研究 | ±1–3% | 严格的证据要求 |
样本量随误差范围减小而呈二次增长——误差缩小一半需要四倍受访者。选择研究目标可接受的最大误差范围。
理解置信水平
95% 的置信水平意味着:如果用不同的随机样本重复调查 100 次,其中 95 次的区间会包含总体真实值。这不代表真实值有 95% 的概率落在某次区间内——一旦收集数据,真实值要么在区间内,要么不在。
更高的置信水平需要更大的样本:
- 从 90% 升至 95% 置信水平,样本量增加约 41%。
- 从 95% 升至 99% 置信水平,样本量增加约 73%。
大多数调查和商业研究,95% 置信水平是标准。高风险决策(医疗、法律、金融)使用 99%。探索性或筛查研究使用 90% 以降低成本。
样本量计算示例
示例 1:全国性调查(未知比例)
某民调机构希望以 95% 置信水平、±3% 误差幅度估计投票意向。由于真实比例未知,使用 p = 0.5(最差情况)。
Z = 1.960,e = 0.03,p = 0.5
n = (1.960)² × 0.5 × 0.5 / (0.03)²
n = 3.8416 × 0.25 / 0.0009
n = 1,068 名受访者
示例 2:客户调查(已知比例)
某公司调查客户满意度。根据历史数据,约 70% 的客户表示满意。他们希望以 95% 置信水平实现 ±5% 误差范围。
Z = 1.960,e = 0.05,p = 0.70
n = (1.960)² × 0.70 × 0.30 / (0.05)²
n = 3.8416 × 0.21 / 0.0025
n = 323 名受访者(p = 0.5 时为 385 名)
示例 3:小总体(有限总体校正)
某人力资源团队对 500 名员工进行调查。他们希望以 95% 置信水平实现 ±5% 误差范围。不校正需要 385 人,应用有限总体校正后:
n₀ = 385,N = 500
nₐ = 385 / (1 + 384 / 500)
nₐ ≈ 218 名员工
相关工具
- A/B 测试计算器 — 检验 A/B 结果的统计显著性。
- A/B 测试样本量计算器 — 为转化率实验规划样本量。
- P 值计算器 — 从测试结果计算统计显著性。
- 转化率计算器 — 计算和比较转化率。