Question 1

什么是卡方检验？

Accepted Answer

卡方检验是一种统计假设检验，用于评估观察频率与预期频率是否存在显著差异。它适用于分类数据，主要有两种形式：拟合优度检验（将单一分类变量与预期分布进行比较）和独立性检验（在列联表中检验两个分类变量之间的关系）。

Question 2

如何计算卡方统计量？

Accepted Answer

卡方统计量的计算公式为：χ² = Σ (O − E)² / E，其中 O 是观察频率，E 是每个类别或单元格的预期频率。将所有类别或单元格的此值求和，得到总 χ² 统计量。

Question 3

拟合优度检验和独立性检验有什么区别？

Accepted Answer

拟合优度检验用于检验单组观察计数是否符合指定的预期分布（例如，骰子是否公平？）。独立性检验使用列联表确定两个分类变量是否相关（例如，性别是否影响产品偏好？）。自由度公式不同：拟合优度为 k − 1，独立性为（行数 − 1）× （列数 − 1）。

Question 4

卡方检验中的自由度是什么？

Accepted Answer

自由度（df）决定使用哪个卡方分布。拟合优度检验：df = k − 1（k = 类别数）。独立性检验：df = (行数 − 1) × (列数 − 1)。例如，3×4 列联表的 df = (3-1) × (4-1) = 6。

Question 5

卡方检验的统计显著性 p 值是多少？

Accepted Answer

标准显著性阈值为 α = 0.05。如果 p 值小于 0.05，结果具有统计显著性，则拒绝零假设。也可以使用 α = 0.10 进行探索性分析，或使用 α = 0.01 进行更严格的标准。p 值表示在零假设为真的情况下，观察到等于或大于当前 χ² 值的概率。

Question 6

卡方检验的最小预期频率是多少？

Accepted Answer

当所有预期单元格频率至少为 5 时，卡方近似是可靠的。如果某些单元格的预期频率低于 5，应考虑合并类别、收集更多数据，或对 2×2 表使用 Fisher 精确检验。极小的预期频率可能使 χ² 统计量膨胀并产生误导性的小 p 值。

Question 7

如何解释每个单元格的贡献？

Accepted Answer

每个单元格对 χ² 的贡献为 (O − E)² / E。贡献大的单元格表明观察计数偏离预期最多。检查各单元格的贡献有助于识别哪些类别或变量组合驱动了总体关联。单个单元格的贡献超过 3.84（df = 1，α = 0.05）表明存在特别大的差异。

Question 8

卡方检验可以用于连续数据吗？

Accepted Answer

不可以。卡方检验仅适用于计数数据（分类变量的频率）。对于连续数据，应使用 t 检验（比较两个均值）、方差分析（比较多个组均值）或皮尔逊/斯皮尔曼相关（测量连续变量之间的关联）。要对连续数据使用卡方检验，必须先将值分组到类别中。

df	α = 0.10	α = 0.05	α = 0.025	α = 0.01
1	2.706	3.841	5.024	6.635
2	4.605	5.991	7.378	9.210
3	6.251	7.815	9.348	11.345
4	7.779	9.488	11.143	13.277
5	9.236	11.070	12.832	15.086
6	10.645	12.592	14.449	16.812
8	13.362	15.507	17.535	20.090
10	15.987	18.307	20.483	23.209
15	22.307	24.996	27.488	30.578
20	28.412	31.410	34.170	37.566

卡方检验计算器

常见问题