5.5 四格表及R × C表的$\chi^2$检验

最后更新:2022/05/12

应用场景:

独立的两个或多个样本(完全随机设计)的计数资料,推断组间差异有无统计学意义。

前提条件:

  • 完全随机设计,两组或多组
  • 计数资料应为二分类或无序多分类
  • 总样本量N≥40;
  • 汇总成四格表或R×C表后,任意格子的理论频数T≥5,或理论频数T<5的格子数不超过总格子数的1/5:

【例5-7】两种消化道溃疡治疗药物的疗效比较

本例数据来自卫生统计学(方积乾)第6版例9-2。

病情相似的169名消化道溃疡患者随机分成两组,分别用奥美拉唑与雷尼替丁两种药物治疗,4周后取得疗效数据,试比较两种药物治疗消化道溃疡的愈合率有无差别。

使用SPSS对该研究数据进行统计分析的具体过程如下:

1. 建立数据集

经整理,数据如下:

img
图5-5-1

2. 四格表卡方检验的操作

(1)先对数据进行加权操作

因为上述数据是频数表数据,所以要进行加权操作;权重为第3列的“频数”(即病例数)

点击菜单:Data => Weight Cases

img
图5-5-2

(2)卡方检验操作

数据加权之后,点击菜单:Analyze => Descriptive Statistics => Crosstabs

img
图5-5-3

设置好行变量(Rows,一般放入分组变量),和列变量(Columns,一般放入结果变量),打开统计量选项(Statistics)的对话框,点选[Chi-square],最后点击【Ok】输出统计结果。

3. 结果解读

经上述菜单操作,默认输出(SPSS 23 64位)的统计结果中包括3个统计表,其中统计描述和卡方检验的结果如下:

image-20220512205819595
图5-5-4

根据Chi-Square Tests表中的Pearson Chi-Square结果($\chi^2=4.13,~ P=0.042$),可作出推断:两种药物治疗消化道溃疡的愈合率差异(75.3% vs 60.7%)有统计学意义。

注意:如何判断本例数据,是否符合卡方检验的适用条件?

以上结果中:

  • Total 即N = 169 > 40;
  • Chi-Square Tests表下方的注释a,明确了:理论频数<5的格子数为0,最小的理论频数是26.84

所以本例数据满足卡方检验所需的条件。

R×C表的卡方检验

数据结构与操作,与四格表的$\chi2$检验完全一致。需要注意的是,如果结局变量是等级资料,不宜使用$\chi2$检验进行组间的比较,而应采用秩和检验的相应方法。

比如下面的数据:

image-20220512222020959

应采用Wilcoxon秩和检验的方法,结果如下:

image-20220513061846236

根据Wilcoxon秩和检验的结果,新药组的平值秩次更大(采用1-无效、2-有效、3-痊愈的编码),且P<0.05,因此可作出新药组疗效更好的推论。

但是,如果采用R×C卡方检验的方法,结果就变成了组间的疗效差异无统计学意义

image-20220513061634044

© By StatX..