马红亮的帖子

数据分析实例 -> 数据分析实例目录 -> 聚类分析

马红亮 -

数据分析实例




    《Integration of problem-based learning in elementary computer science education: effects on computational thinking and attitudes》文章的数据分析使用了多种方差分析,包括重复测量方差分析(repeated ANOVA)、单因素方差分析(one-way ANOVAs)、多元方差分析(MANOVA),这些方差分析都有什么特点,有什么区别?什么是Wilks’s statistic?什么又是Post-hoc tests?

    请参考这里的内容进一步拓展和补充。

      为什么,这篇文章对于plugged-in group和unplugged group计算思维水平的前-中测,前-后测的显著性差异,运用的是Mann-Whitney test而不是我们常用的独立样本t检验或者配对样本t检验呢?其实作者在文章中有一句话做了解释,即Mann-Whitney tests were conducted since assumptions for parametric test were not fulfilled。这里最有可能的是作者做了Levene’s Test for Equality of Variances(方差齐性检验),发现sig的值有显著差异,即不符合方差齐性检验,这样也就不符合做T检验了。

    请大家解释Mann-Whitney 检验的特点、使用条件,以及在本研究中如何使用《 Computational thinking through unplugged activities in early years of primary education》一文中应用的。

   请进一步拓展和补充这里的内容

控制、调节和中介

      回归分析关心两种变量,自变量(X)和因变量(Y)的解释与预测,以X→Y表示。但如果存在一个第三变量(M),可能影响X→Y的关系时,即形成一个第三变量效果。通常,第三变量有中介(mediation)调节(moderation)控制变量(control variable)等类型。【1】
理论模型中的变量类型【4】

(一)调节效应

      调节变量影响自变量与因变量之间关系的方向(正或负)和强弱,调节变量不必是自变量的因果关系。调节作用是研究X对Y的影响时,是否会受到调节变量Z的干扰;比如开车速度(X)会对车祸可能性(Y)产生影响,这种影响关系受到是否喝酒(Z)的干扰,即喝酒时的影响幅度,与不喝酒时的影响幅度是否有着明显的不一样。【2】

  • 模型1:自变量为X,因变量为Y;其意义相对较小(有时候直接忽略此项);
  • 模型2:自变量为X和Z,因变量为Y;模型2仅在模型1的基础上加入调节变量Z;此模型的意义也较小(有时候也可直接忽略此项);
  • 模型3:自变量为X,Z和X*Z,因变量为Y;模型3在模型2的基础上加入交互项;此为核心模型,如果交互项(X*Z)呈现出显著性,则说明具有调节作用。

(二)中介效应

    中介变量则必须是自变量的果,同时也是因变量的因。中介作用是研究X对Y的影响时,是否会先通过中介变量M,再去影响Y;即是否有X->M->Y这样的关系,如果存在此种关系,则说明具有中介效应。比如工作满意度(X)会影响到创新氛围(M),再影响最终工作绩效(Y),此时创新氛围就成为了这一因果链中的中介变量。【3】


  •  模型1:自变量X和因变量Y的回归分析;目的为得到总效应c值;
  •  模型2:自变量X,中介变量M和因变量Y的回归分析;目的是得到直接效应c’值,以及中间效应过程值b;
  •  模型3:自变量X和中介变量M的回归分析;目的是得到中间效应过程值a。
  •  模型1和模型2的区别在于,模型2在模型1的基础上加入了中介变量M。

参考文献:
【1】邱皓政 著 . 量化研究与统计分析:SPSS(PASW)数据分析范例解析[M]. 重庆大学出版社,2013: 268-291.
【2】调节作用分析.  https://spssau.com/helps/questionnaire/rmoderator.html
【3】中介作用分析.  https://spssau.com/helps/questionnaire/advancedMediator.html
【4】陈晓萍,徐淑英,樊景立.  组织与管理研究的实证方法[M].  北京大学出版社,2008.

  • RQ1:Hedge's g可以用来计算总体效应量,它有什么特点,还有其它方法计算总体效应量吗?
  • RQ2:什么是随机效应模型(random-effects model)?有什么特征和应用条件?
  • RQ3:Forest plot 和Funnel plot又有什么区别?
  • RQ4:什么是出版偏差(publication bias),有哪些衡量指标?Rosenthal's Fail-safe和 Orwin's Fail-safe 的数量指什么?
  • RQ5:调节变量分析(Moderator analyses)结果的评判依据是什么?什么是同质性检验(Heterogeneity)?