一、理论原理
(一)方差分析的概念
如果类别变量的内容超过两种水平,统计检验的总体超过两个,此时一次只能比较两个平均数的Z检验或t检验即不适用,而需要一种能同时对两个以上的样本平均数差异进行检验的方法,称为方差分析(analysis of variance),简称ANOVA. 【1】
Z检验和t检验虽可以比较两个平均数的差异,但是无法处理三个或三个以上平均数的比较。当我们有三个以上的平均数需要比较时,可计算这些平均数的方差,然后利用F检验来验证该“平均数的方差”的统计显著性,此即方差分析。
在单因素实验设计中,如果自变量有两个水平,即实验中有两组被试,则F检验与两组Z检验和t检验等效。换句话说,两个独立样本差异的显著性水平可以看作是因素完全随机实验设计的特例。【4】
1. 单因素方差分析(one-way ANOVA)
当研究者所使用的自变量只有一个时,称为单因素方差分析,研究者所关心的是一个自变量对于因变量平均数的影响。单因素方差分析分为独立样本(如三组不同运动量-轻/中/高-对睡眠时间的影响)的方差分析,以及相关或配对样本(同一组不同阶段运动量对睡眠时间的影响)的方差分析。【1】
- 独立样本设计,1个自变量,One-way ANOVA
- 相关样本设计,1个自变量,One-way ANOVA(配对样本或重复测量设计)
- 相关样本设计,1个自变量(具有顺序或时间性),Trend(趋势分析:探讨平均数的变动趋势)
2. 多因素方差分析(factorial analysis of variance)
如果研究者想同时考虑多个类别变量(多个自变量),同时检测多个平均数的差异,此时即需要使用多因素方差分析。教育现象的发生或变化都是由多因素共同作用的结果。多因素方差分析,不仅可以检验各个因素对因变量作用的显著性,而且还可以检验因素与因素间共同结合对因变量发生交互作用的显著性。如一个实验有A、B两个因素,A因素有a1和a2两种水平,B因素有b1和b2两种水平,双因素方差分析可以检验A因素、B因素以及A与B因素交互作用对实验结果影响的显著性。[2]
- 完全独立样本设计,2个自变量独立,two-way ANOVA
- 完全相关样本设计,2个自变量相关,two-way ANOVA
- 相关与独立样本混合设计,1个自变量独立、1个自变量相关,two-way ANOVA mixed desgin(配对样本或重复测量设计)
3. 协方差分析(analysis of covariance,ANCOVA)
有时,研究必须针对某一个连续变量进行统计控制,去除第三变量的混淆效果,而需要使用协方差分析的概念。
- 单因素协方差设计(独立或相关样本),1个自变量、1个或多个共变量, one-way ANCOVA
- 多因素协方差设计(完全独立或混合设计),1个或多个共变量、多个自变量,factorial ANCOVA
4. 多元方差分析(multivariate analysis of variance,MANOVA)
因变量数目的增加,也使得方差分析有不同的应用,称之为多元方差分析(multivariate analysis of variance,MANOVA,多变量方差分析)。【1】MANOVA是统计分析的一般线性模型的推广,适用于存在多个因变量的情况。自变量是类别变量,因变量是连续的。因变量之间可能存在一定程度的相关性。分析结果是对自变量进行F检验统计值,表明该自变量的不同值是否对因变量水平或因变量之间的关系产生统计显著影响。因此,MANOVA对因变量的属性和大小都很敏感。【3】
- 单因素多变量设计,1个自变量,One-way MANOVA
- 多因素多变量设计,多个自变量,Factorial MANOVA
- 单因素多变量协方差分析,1个自变量、1个或多个共变量,One-way MANOVA with covariates
- 多因素多变量协方差分析,多个自变量、1个或多个共变量,Factorial MANOVA with covariates
(二)方差分析的统计假设与效应量
1. 方差分析的统计假设
方差分析需要满足三个重要假设:正态性假设、可加性假设以及方差同质性(homogeneity of variance,即方差齐性)假设。
2. 实务显著性:效应量
效应量(effect size)是指自变量对因变量的影响力强度。在方差分析中,F检验作为一个整体检验,目的是检验自变量效果的统计显著性(statistiacl significance)。然而,F检验却无法说明自变量效果在实务上的意义与价值。此时,需要依赖效果量来反映自变量在真实世界的强度意义,亦即实务显著性(practical significance)或临床显著性(clinical significance)。最直观的效果量指标,是取平均数的差异量。平均数间差异越大,表示自变量的强度越强,称为D量数(Cohen,1988)。