5.5 四格表及R × C表的$\chi^2$检验
最后更新:2022/05/12
应用场景:
独立的两个或多个样本(完全随机设计)的计数资料,推断组间差异有无统计学意义。
前提条件:
- 完全随机设计,两组或多组
- 计数资料应为二分类或无序多分类;
- 总样本量N≥40;
- 汇总成四格表或R×C表后,任意格子的理论频数T≥5,或理论频数T<5的格子数不超过总格子数的1/5:
【例5-7】两种消化道溃疡治疗药物的疗效比较
本例数据来自卫生统计学(方积乾)第6版例9-2。
病情相似的169名消化道溃疡患者随机分成两组,分别用奥美拉唑与雷尼替丁两种药物治疗,4周后取得疗效数据,试比较两种药物治疗消化道溃疡的愈合率有无差别。
使用SPSS对该研究数据进行统计分析的具体过程如下:
1. 建立数据集
经整理,数据如下:
图5-5-1
2. 四格表卡方检验的操作
(1)先对数据进行加权操作
因为上述数据是频数表数据,所以要进行加权操作;权重为第3列的“频数”(即病例数):
点击菜单:Data => Weight Cases ,
图5-5-2
(2)卡方检验操作
数据加权之后,点击菜单:Analyze => Descriptive Statistics => Crosstabs ,
图5-5-3
设置好行变量(Rows,一般放入分组变量),和列变量(Columns,一般放入结果变量),打开统计量选项(Statistics)的对话框,点选[Chi-square],最后点击【Ok】输出统计结果。
3. 结果解读
经上述菜单操作,默认输出(SPSS 23 64位)的统计结果中包括3个统计表,其中统计描述和卡方检验的结果如下:
图5-5-4
根据Chi-Square Tests表中的Pearson Chi-Square结果($\chi^2=4.13,~ P=0.042$),可作出推断:两种药物治疗消化道溃疡的愈合率差异(75.3% vs 60.7%)有统计学意义。
注意:如何判断本例数据,是否符合卡方检验的适用条件?
以上结果中:
- Total 即N = 169 > 40;
- Chi-Square Tests表下方的注释a,明确了:理论频数<5的格子数为0,最小的理论频数是26.84
所以本例数据满足卡方检验所需的条件。
R×C表的卡方检验
数据结构与操作,与四格表的$\chi2$检验完全一致。需要注意的是,如果结局变量是等级资料,不宜使用$\chi2$检验进行组间的比较,而应采用秩和检验的相应方法。
比如下面的数据:
应采用Wilcoxon秩和检验的方法,结果如下:
根据Wilcoxon秩和检验的结果,新药组的平值秩次更大(采用1-无效、2-有效、3-痊愈的编码),且P<0.05,因此可作出新药组疗效更好的推论。
但是,如果采用R×C卡方检验的方法,结果就变成了组间的疗效差异无统计学意义:
© By StatX..