卡方检验计算器
计算拟合优度检验和独立性检验的卡方(χ²)统计量。输入观测频数和期望频数,或填写列联表,即时计算 χ²、自由度、p 值和各单元格贡献值。
χ² = ∑ (Oᵢ − Eᵢ)² / Eᵢ
可用空格、逗号或制表符分隔
数量必须与观测频数相同
常见问题
什么是卡方检验?
卡方检验是一种统计假设检验,用于评估观察频率与预期频率是否存在显著差异。它适用于分类数据,主要有两种形式:拟合优度检验(将单一分类变量与预期分布进行比较)和独立性检验(在列联表中检验两个分类变量之间的关系)。
如何计算卡方统计量?
卡方统计量的计算公式为:χ² = Σ (O − E)² / E,其中 O 是观察频率,E 是每个类别或单元格的预期频率。将所有类别或单元格的此值求和,得到总 χ² 统计量。
拟合优度检验和独立性检验有什么区别?
拟合优度检验用于检验单组观察计数是否符合指定的预期分布(例如,骰子是否公平?)。独立性检验使用列联表确定两个分类变量是否相关(例如,性别是否影响产品偏好?)。自由度公式不同:拟合优度为 k − 1,独立性为(行数 − 1)× (列数 − 1)。
卡方检验中的自由度是什么?
自由度(df)决定使用哪个卡方分布。拟合优度检验:df = k − 1(k = 类别数)。独立性检验:df = (行数 − 1) × (列数 − 1)。例如,3×4 列联表的 df = (3-1) × (4-1) = 6。
卡方检验的统计显著性 p 值是多少?
标准显著性阈值为 α = 0.05。如果 p 值小于 0.05,结果具有统计显著性,则拒绝零假设。也可以使用 α = 0.10 进行探索性分析,或使用 α = 0.01 进行更严格的标准。p 值表示在零假设为真的情况下,观察到等于或大于当前 χ² 值的概率。
卡方检验的最小预期频率是多少?
当所有预期单元格频率至少为 5 时,卡方近似是可靠的。如果某些单元格的预期频率低于 5,应考虑合并类别、收集更多数据,或对 2×2 表使用 Fisher 精确检验。极小的预期频率可能使 χ² 统计量膨胀并产生误导性的小 p 值。
如何解释每个单元格的贡献?
每个单元格对 χ² 的贡献为 (O − E)² / E。贡献大的单元格表明观察计数偏离预期最多。检查各单元格的贡献有助于识别哪些类别或变量组合驱动了总体关联。单个单元格的贡献超过 3.84(df = 1,α = 0.05)表明存在特别大的差异。
卡方检验可以用于连续数据吗?
不可以。卡方检验仅适用于计数数据(分类变量的频率)。对于连续数据,应使用 t 检验(比较两个均值)、方差分析(比较多个组均值)或皮尔逊/斯皮尔曼相关(测量连续变量之间的关联)。要对连续数据使用卡方检验,必须先将值分组到类别中。
卡方公式
**卡方统计量(Chi-Square Statistic, χ²)**衡量观测频数与零假设(Null Hypothesis)下期望频数的偏差程度。核心公式为:
χ² = Σ (Oᵢ − Eᵢ)² / Eᵢ
其中:
- Oᵢ — 第 i 个类别的观测频数
- Eᵢ — 第 i 个类别的期望频数
- Σ — 对所有类别或单元格求和
χ² 值越大,观测频数与期望频数的偏差越大。要判断该偏差是否具有统计显著性,需要将 χ² 统计量与对应自由度下卡方分布的**临界值(Critical Value)**进行比较,或等价地计算 p 值。
拟合优度检验(Goodness of Fit Test)与独立性检验(Test of Independence)
卡方检验主要有两种类型,各自回答不同问题:
| 特征 | 拟合优度检验 | 独立性检验 |
|---|---|---|
| 问题 | 分布是否符合指定的期望分布? | 两个分类变量是否独立? |
| 输入 | 一组观测频数 + 一组期望频数 | 二维列联表(行 × 列) |
| 自由度(Degrees of Freedom, df)公式 | k − 1(k = 类别数) | (行数 − 1)×(列数 − 1) |
| 示例 | 骰子是否公平?数据是否符合已知分布? | 吸烟是否与肺病相关?性别是否影响偏好? |
拟合优度检验
当你有一个分类变量,需要将观测计数与理论期望计数进行比较时,使用拟合优度检验。例如,掷骰子 100 次,每面的期望频数为 100/6 ≈ 16.67。拟合优度检验可判断观测结果是否与该期望存在显著偏差。
独立性检验
当你有两个分类变量,需要判断它们是否存在统计关联时,使用独立性检验(也称列联表卡方检验)。每个单元格的期望频数计算公式为:
Eᵢⱼ = (第 i 行合计 × 第 j 列合计)/ 总计
自由度
自由度(df)决定计算 p 值时使用哪个卡方分布。df 反映在考虑约束条件后独立信息的数量。
- 拟合优度: df = k − 1,其中 k 为类别数。因为观测频数之和必须等于总计数,所以失去 1 个自由度。
- 独立性检验: df = (行数 − 1)×(列数 − 1)。2×2 表的 df = 1;3×4 表的 df = 6。
df 越大,卡方分布向右偏移越多,在同一显著性水平下需要更大的 χ² 值才能达到统计显著性。
卡方临界值表
下表给出常见自由度和显著性水平下的 χ² 临界值。若计算所得 χ² 超过临界值,则结果具有统计显著性。
| df | α = 0.10 | α = 0.05 | α = 0.025 | α = 0.01 |
|---|---|---|---|---|
| 1 | 2.706 | 3.841 | 5.024 | 6.635 |
| 2 | 4.605 | 5.991 | 7.378 | 9.210 |
| 3 | 6.251 | 7.815 | 9.348 | 11.345 |
| 4 | 7.779 | 9.488 | 11.143 | 13.277 |
| 5 | 9.236 | 11.070 | 12.832 | 15.086 |
| 6 | 10.645 | 12.592 | 14.449 | 16.812 |
| 8 | 13.362 | 15.507 | 17.535 | 20.090 |
| 10 | 15.987 | 18.307 | 20.483 | 23.209 |
| 15 | 22.307 | 24.996 | 27.488 | 30.578 |
| 20 | 28.412 | 31.410 | 34.170 | 37.566 |
卡方计算示例
示例 1:拟合优度检验 — 骰子是否公平
掷骰子 100 次,观测结果:16、18、16、14、12、24。骰子公平吗?每面的期望频数:100 / 6 ≈ 16.67。
χ² = (16 − 16.67)² / 16.67 + (18 − 16.67)² / 16.67 + ...
χ² ≈ 4.68,df = 5
p 值 ≈ 0.456
不显著(α = 0.05)。无证据表明骰子不公平。
示例 2:独立性检验 — 性别与产品偏好
调查 100 人:男女对产品的偏好是否不同?列联表:男性 — 20 人偏好 A,30 人偏好 B;女性 — 35 人偏好 A,15 人偏好 B。
行合计:男性 = 50,女性 = 50
列合计:A = 55,B = 45,总计 = 100
期望频数(男性,A)= 50 × 55 / 100 = 27.5
χ² ≈ 8.08,df = 1
p 值 ≈ 0.004
显著(α = 0.05)。性别与产品偏好相关。
假设与局限
- 独立性: 每个观测必须相互独立。重复测量或聚类数据违反此假设。
- 期望频数规则: 每个单元格的期望频数应至少为 5。否则应考虑合并类别或使用 Fisher 精确检验(适用于 2×2 表)。
- 分类数据: 卡方检验仅适用于计数数据,不适用于均值或以小数表示的比例。对于连续数据,应使用 t 检验或方差分析。
- 样本量: 样本量越大,卡方近似越准确。样本量极小时 p 值可能不可靠。
- 双侧检验: 卡方检验本质上是无方向性的,只能检测偏离期望分布的情况,无法判断偏离方向。