4.9 重复测量设计的方差分析(Repeated measures ANOVA)

最后更新:2023-02-21

应用场景:

同一研究对象,在不同条件下对相同指标进行测量(测量次数≥3,如果等于2就是配对设计),如接受治疗的乙肝活动期患者,每隔一定时间检查转氨酶水平,又比如不同受试者的血样分成3份,采用不同方法进行检测,等等;此类研究的类型就是重复测量设计,取得的结果即为重复测量资料,可采用本方法,对不同测量(如不同时点间的结果、不同方法的结果)之间的差异进行检验

在重复测量设计的方差分析中,“重复测量”作为一个独立的因素,上述不同的时点、不同的检测方法,即为重复测量因素的水平;除重复测量这一因素外,也可以将处理因素或影响因素纳入方差分析模型中。

需要注意的是,如果研究对象的不同测量是随机分配的,(在没有其它分组因素的情况下)属于随机区组设计,应采用4.5 随机区组设计(两因素)方差分析的方法。比如,Sheng-Hsiung Hsu等(1991)[1] 报告了不同筷子的长度对取食效率的影响,31名研究对象随机使用6种不同长度的筷子,进行食物的夹取实验获得取食效率(夹取花生米的数量)数据,虽然每一名研究对象都有这6次测量的结果(6种不同长度筷子的取食效率),但因为不同的测量是随机安排的,每个研究对象使用不同长度筷子的顺序也是不同的,因此不属于重复测量设计。

适用条件:

  • 重复测量设计(重复测量水平数≥3),结果为计量资料;
  • 重复测量各水平(不同测量)上的数据服从正态分布;
  • 不同研究对象之间相互独立;
  • 研究对象不同测量之间的差值具有方差齐性

【例】不同性别青少年发育过程中脑垂体中心至翼上颌裂间距的比较

北卡罗来纳大学牙科学院(国内称之为口腔医学院)的研究人员收集了27名青少年不同年龄(8/10/12/14岁)时期的脑垂体中心至翼上颌裂的间距[2] (具体如何进行测量及其临床意义请忽略,我们重点关注数据与统计),数据在此:(Potthoff+Roy-Biomet1964.pdf (umass.edu))。

试分析不同性别青少年不同年龄阶段的脑垂体中心至翼上颌裂的间距有无差异。


根据本研究所收集的数据,我们考虑采用重复测量设计的方差分析方法。使用SPSS对该数据进行统计分析的具体过程如下:

1. 建立数据集

建立好的数据集,数据列表如下所示:

img

数据集中,Group=1示Girls,Group=2示Boys,age8至age14分别为各年龄时期的脑垂体中心至翼上颌裂的间距(单位为mm)数据。

根据对各次测量的数据进行探索(参见:2.1 计量资料的数据分布与正态性检验),发现个别数据的正态性不好:

image-20220921223556574

从各次测量的直方图可以看出,由于样本量较小,数据分布的对称性直观上较差。

img

鉴于在大多数情况下,方差分析的稳健性较好,我们决定仍然采用方差分析方法分析本研究数据。当然,如果担心数据分布的问题会对统计结果产生影响,也可以考虑使用非参数的方法进行统计推断(具体参见:随机区组设计的Friedman M检验)。

2. 重复测量设计的方差分析操作

选择一般线性模型(General Linear Model)中的重复测量(Repeated Measures)分析方法,设置重复测量的水平(同一人在不同年龄上测量了4次,故设置重复测量的水平为4)

img

注意:上述对话框中的ages为重复测量因素的名称(默认名称为factor1),修改与否并不影响统计结果,本例进行了修改,故ages为重复测量因素

将数据集中的4次测量结果放入Within-Subjects Variables(ages) 中,将group放入Between-Subject Factor中,并设置重复测量的模型为Full factorial

img

变量与模型均设置好,点击【OK】按钮即可输出统计结果。

3. 结果解读

(SPSS 23 64位)输出的统计结果较多,我们选择需要的表格:

3.1 Mauchly's Test of Sphericity(Mauchly球形检验)

image-20220921233644681

在适用条件中,不同测量间差值的方差是否相等(即齐性),可通过Mauchly球形检验的结果来确定,$P\gt 0.05$ 意味着球形性假定满足,即可假定重复测量之间差值的方差是齐的;若$P\le 0.05$则需要采用校正的方法,或多元方差分析(MANOVA,在模型中设置多个应变量)方法。

3.2 重复测量因素(ages)不同水平的比较

本例Mauchly球形检验通过,选择Tests of Within-Subjects Effects表中Sphericity Assumed(球形性假定满足)所在行的结果:

image-20220921235038241

1)结果1(推断1)--重复测量因素的假设检验:

重复测量因素(ages)上,脑垂体中心至翼上颌裂的间距,差异有统计学意义($F=35.347, P \lt 0.001$),可作出推断:青少年阶段(无论男女),随年龄的增长,脑垂体中心至翼上颌裂的间距是有所变化的(结合下面的交互效应图可知间距在增加);

2)结果2(推断2)--交互作用:

重复测量因素与分组因素的交互作用(ages*group)没有统计学意义($F=2.362, P = 0.078$),尚不能认为青少年脑垂体中心至翼上颌裂的间距在不同年龄上的差异在不同性别中有所不同

通过绘制重复测量上的效应图,也可直观查看重复测量间的差异以及与分组因素的交互作用:

image-20220922002655033

可以看到,输出的边际均值在各测量上的差异还是比较明显的(随年龄增长间距变大的趋势明显),而不同分组(Girls vs Boys)之间,这种变化趋势有差异但不明显(两条折线不完全平行,但随年龄增长的变化方向基本一致),如下图所示:

image-20220922002917220

如果在交互效应图中看到的是相交的折线,往往意味着交互作用是存在的(此时假设检验的P值≤0.05)。

3.3 分组因素不同水平的比较

根据表Tests of Between-Sujects Effects

image-20230307162511070

可知:

不同分组(Girls vs Boys)的脑垂体中心至翼上颌裂的间距,差异有统计学意义($F=9.292,~P=0.005$),由此可推断:

青少年脑垂体中心至翼上颌裂的间距,在不同性别之间存在差异。

3.4 若球形性假定不满足

Tests of Within-Subjects Effects表中,Sphericity Assumed所在行是球形性假定满足(即适用条件中的方差齐)时应选择的方差分析结果;Greenhouse-Geisser(GG方法)及Huynh-Feldt(HF方法)所在行,是球形性假定不满足时,GG和HF两种不同校正方法的结果。

Box (1954) 定义了一个球形指数(记为 $\epsilon$)用于总体协方差矩阵的球形性度量,$\epsilon$的值域在0-1之间,若$\epsilon = 1$则表示数据具有完全的球形性,不同重复测量之间的差值具有方差齐性;若$\epsilon \lt 1$,越小表示球形性越差,也就越不符合所需的方差齐性要求。

GG方法和HF方法,均是对$\epsilon$的估计(记为$\hat{\epsilon}$,相应的估计值见Mauchly's Test of Sphericity表中Epsilon部分),并据此调整方差分析中的自由度。

研究表明,GG校正的结果多趋于保守(即$\hat{\epsilon}$偏小,经校正后的P值偏大),而HF的校正方法通常过于宽松($\hat{\epsilon}$偏大,经校正后的P值偏小)。其实在实际应用中,两种校正方法的结果多数情况下非常接近,而且对应的推断结果也是一致的;如果经GG和HF方法校正后,方差分析的结果不一致(P值分别在0.05上下),推荐采用GG方法校正的结果

3.5 什么情形需要使用重复测量的方差分析方法

除数据应满足本文列出的适用条件外,一个最重要的前提,是检验的目的是为证明什么。事实上,重复测量的数据,不一定要使用重复测量的分析方法。具体细节请参考 重复测量的数据,一定要使用重复测量分析方法?

3.6 与随机区组设计方差分析的关系

如果数据中仅包含重复测量因素,没有分组(处理/影响)因素,那么,把不同的重复测量视为处理因素、不同观察对象视为区组因素,按照随机区组设计进行方差分析(统计分析时的数据结构将有所变化),我们将会看到:

无论采用固定效应模型,还是混合效应模型(重复测量因素作为固定效应因素,观察对象作为随机效应因素),随机区组设计的方差分析结果中,处理因素(实际为重复测量因素)假设检验结果与重复测量方差分析中未校正的结果(前述Tests of Within-Subjects Effects表中第1行),完全一致

对于本例数据,因为存在分组(性别)因素,情况稍复杂,我们把上述相同的数据,整理成如下结构:

image-20230307211329194

此数据集中:SubjectID为观察对象的编号,Group为分组(Girls/Boys),Ages为年龄因素(实为重复测量因素,这里按处理因素对待),Dist为脑垂体中心至翼上颌裂的间距。

采用一般线性模型进行方差分析,建立如下的方差分析模型:

image-20230307212300854

可得到与重复测量方差分析相同的结果:

img

可以看到,Ages(作为处理因素,实为重复测量因素)的假设检验结果,与“Tests of Within-Subjects Effects表”中重复测量因素(ages)未经校正的的检验结果完全一致。

[1] S-H. Hsu and S-P.Wu (1991). "An Investigation for Determining the Optimum Length of Chopsticks," Applied Ergonomics, Vol. 22, #6, pp. 395-400.

[2] Potthoff, Richard F. and S. N. Roy. “A generalized multivariate analysis of variance model useful especially for growth curve problems.” Biometrika 51 (1964): 313-326.

© By StatX..