方差分析、协方差分析以及事后比较-ANOVA,ANCOVA & Post Hoc

方差分析、协方差分析以及事后比较-ANOVA,ANCOVA & Post Hoc

马红亮 -
回帖数:3

一、理论原理

     方差分析分单因素方差分析(One-way ANOVA)、多因素方差分析(Factorial ANOVA)、协方差分析(ANCOVA)、多重因变量方差分析(MANOVA)。常用于单因素实验设计、两因素实验设计、三因素实验设计、多元方差分析实验设计的数据处理。

(一)方差分析的概念

        如果类别变量的内容超过两种水平,统计检验的总体超过两个,此时一次只能比较两个平均数的Z检验或t检验即不适用,而需要一种能同时对两个以上的样本平均数差异进行检验的方法,称为方差分析(analysis of variance),简称ANOVA. 【1】

      Z检验和t检验虽可以比较两个平均数的差异,但是无法处理三个或三个以上平均数的比较。当我们有三个以上的平均数需要比较时,可计算这些平均数的方差,然后利用F检验来验证该“平均数的方差”的统计显著性,此即方差分析。

      在单因素实验设计中,如果自变量有两个水平,即实验中有两组被试,则F检验与两组Z检验和t检验等效。换句话说,两个独立样本差异的显著性水平可以看作是因素完全随机实验设计的特例。【4】

   1. 单因素方差分析(one-way ANOVA)  

    当研究者所使用的自变量只有一个时,称为单因素方差分析研究者所关心的是一个自变量对于因变量平均数的影响。单因素方差分析分为独立样本(如三组不同运动量-轻/中/高-对睡眠时间的影响)的方差分析,以及相关或配对样本(同一组不同阶段运动量对睡眠时间的影响)的方差分析。【1】

  • 独立样本设计,1个自变量,One-way ANOVA
  • 相关样本设计,1个自变量,One-way ANOVA(配对样本或重复测量设计)
  • 相关样本设计,1个自变量(具有顺序或时间性),Trend(趋势分析:探讨平均数的变动趋势)

     2. 多因素方差分析(factorial analysis of variance)

     如果研究者想同时考虑多个类别变量(多个自变量),同时检测多个平均数的差异,此时即需要使用多因素方差分析。教育现象的发生或变化都是由多因素共同作用的结果。多因素方差分析,不仅可以检验各个因素对因变量作用的显著性,而且还可以检验因素与因素间共同结合对因变量发生交互作用的显著性。如一个实验有A、B两个因素,A因素有a1和a2两种水平,B因素有b1和b2两种水平,双因素方差分析可以检验A因素、B因素以及A与B因素交互作用对实验结果影响的显著性。[2]

  • 完全独立样本设计,2个自变量独立,two-way ANOVA
  • 完全相关样本设计,2个自变量相关,two-way ANOVA
  • 相关与独立样本混合设计,1个自变量独立、1个自变量相关,two-way ANOVA mixed desgin(配对样本或重复测量设计)

    3. 协方差分析(analysis of covariance,ANCOVA)

    有时,研究必须针对某一个连续变量进行统计控制,去除第三变量的混淆效果,而需要使用协方差分析的概念。

  • 单因素协方差设计(独立或相关样本),1个自变量、1个或多个共变量, one-way ANCOVA
  • 多因素协方差设计(完全独立或混合设计),1个或多个共变量、多个自变量,factorial ANCOVA

    4. 多元方差分析(multivariate analysis of variance,MANOVA)

     因变量数目的增加,也使得方差分析有不同的应用,称之为多元方差分析(multivariate analysis of variance,MANOVA,多变量方差分析)。【1】MANOVA是统计分析的一般线性模型的推广,适用于存在多个因变量的情况。自变量是类别变量,因变量是连续的。因变量之间可能存在一定程度的相关性。分析结果是对自变量进行F检验统计值,表明该自变量的不同值是否对因变量水平或因变量之间的关系产生统计显著影响。因此,MANOVA对因变量的属性和大小都很敏感。【3】

  • 单因素多变量设计,1个自变量,One-way MANOVA
  • 多因素多变量设计,多个自变量,Factorial MANOVA
  • 单因素多变量协方差分析,1个自变量、1个或多个共变量,One-way MANOVA with covariates
  • 多因素多变量协方差分析,多个自变量、1个或多个共变量,Factorial MANOVA with covariates

(二)方差分析的统计假设与效应量

    1. 方差分析的统计假设

     方差分析需要满足三个重要假设:正态性假设、可加性假设以及方差同质性(homogeneity of variance,即方差齐性)假设。

    2. 实务显著性:效应量

     效应量(effect size)是指自变量对因变量的影响力强度。在方差分析中,F检验作为一个整体检验,目的是检验自变量效果的统计显著性(statistiacl significance)。然而,F检验却无法说明自变量效果在实务上的意义与价值。此时,需要依赖效果量来反映自变量在真实世界的强度意义,亦即实务显著性(practical significance)或临床显著性(clinical significance)。最直观的效果量指标,是取平均数的差异量。平均数间差异越大,表示自变量的强度越强,称为D量数(Cohen,1988)

(三)协方差的基本原理

      对无关的干扰变量的控制,有两种,其一是过程控制(procedural control),如随机抽样、使研究程序标准化等;其二是实验控制(experimental control),即针对有可能造成干扰的变量加以测量,再利用实验设计的操作与统计的方法,将该因素的效果以“自变量”的角色纳入分析。【1】
      实验控制的操作,是将控制变量与自变量共处一室,去讨论与因变量的关系,也就是一种多因子设计研究。……在统计学领域,为了处理干扰变量的影响,发展出协方差分析(ANCOVA),以数学原理进行统计控制,来处理控制变量与其它自变量共同影响因变量的情形。 在实验研究中,协方差分析多用于具有前后测设计的研究中。由前测所测得变量可以作为控制变量,因变量则为实验之后针对同一个变量再次测量所得到的后测分数。【1】  
    回归同质性假设(assumption of homogeneity of regression)是ANCOVA的一项重要假设。为了确保协方差的控制效果在各组等同,在进行ANCOVA之前,必须针对此一假设进行检验。如果虚无假设被接受,表示协方差造成的调整效果在各组内具有一致的作业,组间的差异在不同的协方差数值之下具有一致性。【1】
  

(四)单因变量分析(Univariate Tests)

      单因变量统计检验是指涉及一个因变量(one dependent variable)的检验。案例包括均值t检验、方差分析(ANOVA)、协方差分析、线性回归和广义线性模型,如二元逻辑回归。在所有这些情况下,只有一个因变量。相比之下,多元方差分析(MANOVA)、多元协方差分析(MANCOVA)和典型相关等方法都是多元统计分析中使用的多元检验(multivariate tests)的例子。【5】 


参考文献
【1】邱皓政 著 . 量化研究与统计分析:SPSS(PASW)数据分析范例解析[M]. 重庆大学出版社,2019:156-172.
【2】王孝玲. 教育统计学[M]. 上海:华东师范大学出版社, 2014:152-158.
【3】Franzen M.D. (2011) Multivariate Analysis of Variance. In: Kreutzer J.S., DeLuca J., Caplan B. (eds) Encyclopedia of Clinical Neuropsychology. Springer, New York, NY. https://doi.org/10.1007/978-0-387-79948-3_1869
【4】杜晓新. 心理与教育研究中实验设计与SPSS数据处理. 北京: 北京大学出版社, 2013:32.
【5】Zumbo B.D. (2014) Univariate Tests. In: Michalos A.C. (eds) Encyclopedia of Quality of Life and Well-Being Research. Springer, Dordrecht. https://doi.org/10.1007/978-94-007-0753-5_3110
回复马红亮

回复: 方差分析、协方差分析-ANOVA & ANCOVA

马红亮 -

(五)多重比较:事前与事后检验

      当方差分析F检验值达到显著水平,表示至少有两组平均数之间有显著性差异存在。但究竟是哪几个平均数之间显著有所不同,必须进一步进行多重比较(multiple comparison)来检验。如果多重比较在F检验之前进行,称为事前比较(priori comparisons),在获得显著的F值之后进行的多重比较,称为事后比较(posteriori comparasions)。【1】

     在事后比较(也称Post Hoc Comparison)方面:【1】

(1)未违反方差同质(Equal Variance Assumed)假定的多重比较方法有(按从最敏感到最保守的顺序排列):

  • LSD法(Least-significant difference),与t检验原理类似,以平均数差异的检验为主要策略,缺点是并没有因为是多次的比较而调整检验的观察显著水平(p),是比较粗糙的多重比较程序。
  • LSD法、HSD法(Tukey)、Newman-Keuls法(S-N-K)均适用于每一组样本人数相同的情况。但当各组人数不相等时,每次比较的检验力则有所不同。
  • Scheffe's method,与上述其它多重比较方法不同,该方法提出以F检验为基础的n不相等(各组人数不相等)的多重比较技术。由于直接采用F检验,因此Scheffe法无须其他的查表程序,使用上非常方便。Scheffe检验可以广泛地适用于成对比较以及各种复杂比较。

 (2)违反方差同质(Equal Variance Not Assumed)假定的多重比较方法有:

  • Dunnett's T3法,样本数不同最有可能的影响是造成违反方差同质假设,此时可以采用Dunnett(1980)的T3法来处理。……值得注意的是,ANOVA在各组方差不同质,也就是违反方差同质性假设时,并不会对F检验进行校正,此时需采用校正程序来进行各平均数的事后比较,才能处理方差不同质所造成的对平均数比较的影响,此时建议使用Dunnett的T3法。
参考文献
   【1】邱皓政 著 . 量化研究与统计分析:SPSS(PASW)数据分析范例解析[M]. 重庆大学出版社,2019:158-167.


回复马红亮

回复: 方差分析、协方差分析以及事后比较-ANOVA,ANCOVA & Post Hoc

马红亮 -

二、数据分析实例

(一)方差分析(ANOVA)

1. 单因素方差分析(one-way ANOVA)

2. 重复测量方差分析(Repeated Measures ANOVA)

3. 二因素方差分析(two-way ANOVA)

4. 三因素方差分析(three-way ANOVA)
  • Jiang, S., & Wong, G.K.W. (2022). Exploring age and gender differences of computational thinkers in primary school: A developmental perspective. Journal of Computer Assisted Learning, 1,(38),60-75. (RQ2+RQ3:对小学生实验的CT进行年龄(3组)、实验条件(实验和对照组)以及测试时间(前测和后测)进行三因素方差分析,年龄和实验条件是组间因素(被试间变量),测试时间是组内因素(被试内变量),结果发现测试时间和条件有交互作用;还发现年龄和实验条件的交互作用明显。)
4. 多变量方差分析(multivariate analysis of variance,MANOVA)
  • Kwon, K., Ottenbreit-Leftwich, A.T., Brush, T.A. et al. (2021). Integration of problem-based learning in elementary computer science education: effects on computational thinking and attitudes. Educational Technology Research and Development, 69, 2761–2787. (在4所小学200名6年级学生中,开展PBL编程教育的准实验研究,分别对前测、后测1和后测2中的6种CT概念(6个因变量)进行了MANOVA分析。使用Wilks统计分析了6种CT概念在每次测试中的总体差异情况和效应量(𝜂2),以及使用单独单变量检验(Separate univariate tests)分析6种CT概念相互之间的高低关系。)
回复马红亮

回复: 方差分析、协方差分析以及事后比较-ANOVA,ANCOVA & Post Hoc

马红亮 -

(二)协方差分析(ANCOVA)


1. 单因素协方差分析(one-way ANCOVA)


  • Yılmaz, R. (2020).  Enhancing community of inquiry and reflective thinking skills of undergraduates through using learning analytics-based process feedbackJournal of Computer Assisted Learning, 36(6),909-921.(主要探索了应用基于学习分析的过程反馈对学生探究社区感知和反思技能的影响,研究者运用前后测控制组的实验研究,104名大学生被随机分配到实验组(51)和控制组(49),实验组(EG)接受基于学习分析的过程性反馈的翻转学习,控制组只是单纯的翻转学习。在数据分析方面,满足数据正态分布、方差同质性、协变量和实验处理的独立性、回归斜率同质等条件,因此研究者采用ANCOVA,控制前测的影响,比较两组后测的差异。表1为探究社区的协方差分析。)