配对和独立样本t检验- paired samples & independent samples t-test

配对和独立样本t检验- paired samples & independent samples t-test

马红亮 -
回帖数:1

一、理论原理

    t检验分独立样本t检验和配对样本t检验,经常用于单组前后测实验设计(配对样本)和双组前后测实验设计(独立样本)、双组延时实验设计(独立样本)的平均值差异显著性检验中。【4】

(一)相关样本和独立样本

    1. 相关样本
    两个样本内个体之间存在着一一对应的关系,这两个样本称为相关样本。相关样本有两种情况:【1】
  • 用同一个测验对同一组被试在实验前后进行两次测验,所获得两组测验结果是相关样本。
  • 估计某些条件基本相同的原则,把被试一一匹配成对,然后将每对被试随机地分入实验组和对照组,对两组被试施行不同的实验处理之后,用同一个测验所获得的测验结果,也是相关样本。
   2. 独立样本
      在教育研究中,对同一组被试在实验前后施以同一个测验,有时会产生两次测验的效应。而挑选条件相同的对象,进行配对比较,也较为困难。因此在实际应用时,经常利用独立样本对总体平均数的差异进行检验。两个样本内的个体是随机抽取的,它们之间不存在一一对应的关系,这样的两个样本称为独立样本。【1】一般来说,如果是独立样本,则需要对两样本进行方差齐性(同质性)检验相关样本则被认为是基本同质的,只进行相关检验(correlation)。【4】

      两个样本容量都大于或等于30的独立样本称为独立大样本;两个样本容量都小于30,或其中一个小于30的独立样本称为独立小样本。

(二)t检验的概念和类型

    1. t检验的概念
      连续变量的测量数据,适合以描述统计的集中趋势量数与离散量数来描绘观察结果。连续变量的分析与检验,通常与平均数与方差的检验有关。
      在平均数检验方法中,总体的标准差是否已知,有不同的处理模式:当总体的标准差已知时,进行Z检验;当总体标准差未知时,需要使用t检验。一般而言,总体的标准差多无法得知,因此使用Z检验的机会并不多另一方面,由于t分布随着自由度的改变而改变,当n大于30时,t分布于Z分布十分接近。使用t检验其实涵盖了Z检验的应用。在数据分析实务中,多以t检验来进行单样本的平均数检验或平均数的差异检验。
      t检验有单总体平均数检验(某大学一年级新生的平均年龄19.2岁是否与全国大一新生的平均年龄18.7岁相同),双总体平均数检验(独立样本与相关样本)。独立样本的平均数检验,如某大学一年级新生男生的平均年龄21.2岁,是否与女生的平均年龄19.7岁相同。相关样本(配对样本)的平均数检验,如某一群被试参加自我效能训练方案前后的两次得分的自我效能平均数的比较。【2】

     2. 单尾与双尾检验
      当研究者只关心单一一个方向的比较关系时(如男生的数学成绩X1优于女生X2),平均数的检验仅有一个拒绝区,需使用单尾检验(one-tailed test)。当研究者并无特定方向的设定(如男生的智商与女生的智商有所不同),假设检验在两个阶段的情况下皆有可能发生,而必须设定两个拒绝区,此时即需要使用双尾检验(two-tailed test)。【2】
     采用单尾检验必须提出支持证据,除非理论文献支持单侧的概念,或是变量间的关系具有明确的线索显示必须使用单侧检验,否则需采用双侧检验来检验平均值的特性。

(三)t检验的基本假设

    1. 正态性假设(assumption of normality)

    当样本数量不足时,抽样分布即无法符合正态性分布的要求,使得假设检验的理论根据失效。双样本平均数检验中,两个平均数来自两个样本,除了样本本身的抽样分布须为正态化之外,两个平均数的差的抽样分布也必须符合正态分布。正态性的违反,会导致整个统计检验的失效,所得的结果偏失不可信。  通常使用Shapiroe-Wilk test进行正态分布假设检验。【2】

   2. 方差同质性(齐性)假设(homogeneity of variance)

       独立样本t检验的功能在于比较不同样本的平均数差异,每一个正态化样本的平均数要能够相互比较,还必须具有相似的离散情况,也就是样本的方差必须同质性(齐性),称为样本方差同质性。方差同质性假设若不成立,会使得平均数的比较存有混淆因素。
      两个独立样本方差同质性假设是否违反,可以利用Levene's test of homogeneity,以方差分析(F检验)的概念,计算两个样本方差的比值。若F检验达到显著水平,表示两个样本的方差不同质,此时需要校正公式来计算t值。 方差不齐的独立样本平均数差异的显著性检验可以用t'检验。【2】  

(四)效应量(effect size)

    效应量(effect size)是指自变量对因变量的影响力强度。最直观的效应量指标,是取平均数的差异量。平均数间差异越大,表示自变量的强度越强,称为d量数(Cohen,1988)。【3】
  • Weak |d| < 0.2;
  • Weak to moderate: 0.2 < |d| < 0.4;
  • Moderate: 0.40 < |d| < 0.65;
  • Moderate to strong: 0.65 < |d| < 0.8;
  • Strong: 0.8 < |d|.

参考文献
[1]  王孝玲. 教育统计学[M]. 上海:华东师范大学出版社, 2014: 108-118.
[2]邱皓政 著 . 量化研究与统计分析:SPSS(PASW)数据分析范例解析[M]. 重庆大学出版社,2019:143-150.
[3] Rubin A. (2012).  Statistics for evidence-based practice and evaluation. Cengage Learning.
[4] 杜晓新. 心理与教育研究中实验设计与SPSS数据处理. 北京: 北京大学出版社, 2013:15-28.

回复马红亮

回复: 配对和独立样本t检验- paired samples & independent samples t-test

马红亮 -

二、数据分析实例

1. 单样本t检验(one-sample t-test)

2. 配对样本t检验(paired samples t-test)

3. 独立样本t检验(independent samples t-test)