5.3 多个独立样本的Kruskal-Wallis秩和检验
最后更新:2023/09/09
应用场景:
多个独立的样本(完全随机设计,组数≥3)的计量资料或等级资料,推断组间分布位置有无差异。
因为这个方法的统计量以$H$表示:$H = \frac{12}{N(N+1)} \sum_{i=1} {k} \frac{R_i 2}{n_i}-3(N+1)$
所以,这个方法也称为Kruskal-Wallis H test。
前提条件:
- 分布未知或不服从正态分布的计量资料;或者等级资料;
- 完全随机设计,分组数≥3;
注意:
在上一教程(Wilcoxon秩和检验)中,同样有分布未知的计量资料这一应用条件,如何作出分布未知的判断,当然没有相应的统计方法;从实践角度来说,如果我们面对的计量资料没有外部信息证明它是服从正态分布的,那么单组样本量(n)在10以内的数据,均应视为分布未知,因为所有的检验数据是否服从正态分布的统计方法,对样本量都是非常敏感的,n ≤10 对于 Shapiro-Wilk, Kolmogorov-Smirnov等正态性检验方法来说,检验效能都是非常低的。因此保守起见,对于小样本计量资料,尤其是那些数据变异比较明显的,应更倾向于视为“分布未知”而采用非参数的检验方法。
本方法我们只给出一个等级资料的例子,针对计量资料的Kruskal-Wallis秩和检验,分析与推断过程与之完全相同。
【例5-4】重组人白细胞生成素预防化疗后白细胞减少的临床研究
汪晓洁等[1] 采用不同剂量的基因重组人粒细胞集落刺激因子(rhG-CSF)预防晚期非小细胞肺癌(non-small cell lung cancer,NSCLC)化疗后白细胞减少症,探讨该药合理的应用策略。
本试验共纳入受试者126人,随机分为A、B、C共3组,各组给予rhG-CSF的总剂量分别为:300μg、600μg、900μg。
使用SPSS对该研究数据进行统计分析的具体过程如下:
1. 建立数据集
经整理,数据列表(数据视图)如下:
图5-4-1
其中,Group=1示A组,Group=2示B组,Group=3示C组;变量WBC为白细胞减少程度的分级,0表示未发生白细胞减少,1-4与减少程度I-IV级对应;Freq为频数。
因为使用了频数表,因此在分析之前先行加权操作(可参看之前的教程)。
2. Kruskal-Wallis秩和检验操作
点击菜单:
Analyze => Nonparametric Tests => Legacy Dialogs => k Independent Samples,
图5-4-2
设置好检验的变量(Test Variable List),统计方法(Test Type,默认勾选的就是Kruskal-Wallis秩和检验),分组信息(Define Range),如果是计量资料,还可设置输出统计描述(Options->Descriptive)的结果,最后点击【Ok】输出统计结果。
3. 结果解读
经上述菜单操作,默认输出(SPSS 27 64位)的统计结果中包括2个统计表:
图5-4-3
Kruskal-Wallis秩和检验的结果显示,应用3种不同剂量rhG-CSF的受试者,发生白细胞减少的程度不尽相同,差异具有统计学意义($H=16.03, P<0.001$)。
[1]汪晓洁,寿涛,胡静等.不同剂量rhG-CSF预防晚期非小细胞肺癌化疗后白细胞减少的临床研究[J].中国癌症杂志,2015,25(10):823-827.
© By StatX..