数据分析实例: 配对和独立样本t检验- paired samples & independent samples t-test

一、理论原理

t检验分独立样本t检验和配对样本t检验，经常用于单组前后测实验设计（配对样本）和双组前后测实验设计（独立样本）、双组延时实验设计（独立样本）的平均值差异显著性检验中。【4】

（一）相关样本和独立样本

1. 相关样本

两个样本内个体之间存在着一一对应的关系，这两个样本称为相关样本。相关样本有两种情况：【1】

用同一个测验对同一组被试在实验前后进行两次测验，所获得两组测验结果是相关样本。
估计某些条件基本相同的原则，把被试一一匹配成对，然后将每对被试随机地分入实验组和对照组，对两组被试施行不同的实验处理之后，用同一个测验所获得的测验结果，也是相关样本。

2. 独立样本

在教育研究中，对同一组被试在实验前后施以同一个测验，有时会产生两次测验的效应。而挑选条件相同的对象，进行配对比较，也较为困难。因此在实际应用时，经常利用独立样本对总体平均数的差异进行检验。两个样本内的个体是随机抽取的，它们之间不存在一一对应的关系，这样的两个样本称为独立样本。【1】一般来说，如果是独立样本，则需要对两样本进行方差齐性（同质性）检验。相关样本则被认为是基本同质的，只进行相关检验（correlation）。【4】

两个样本容量都大于或等于30的独立样本称为独立大样本；两个样本容量都小于30，或其中一个小于30的独立样本称为独立小样本。

（二）t检验的概念和类型

1. t检验的概念

连续变量的测量数据，适合以描述统计的集中趋势量数与离散量数来描绘观察结果。连续变量的分析与检验，通常与平均数与方差的检验有关。

在平均数检验方法中，总体的标准差是否已知，有不同的处理模式：当总体的标准差已知时，进行Z检验；当总体标准差未知时，需要使用t检验。一般而言，总体的标准差多无法得知，因此使用Z检验的机会并不多。另一方面，由于t分布随着自由度的改变而改变，当n大于30时，t分布于Z分布十分接近。使用t检验其实涵盖了Z检验的应用。在数据分析实务中，多以t检验来进行单样本的平均数检验或平均数的差异检验。

t检验有单总体平均数检验（某大学一年级新生的平均年龄19.2岁是否与全国大一新生的平均年龄18.7岁相同），双总体平均数检验（独立样本与相关样本）。独立样本的平均数检验，如某大学一年级新生男生的平均年龄21.2岁，是否与女生的平均年龄19.7岁相同。相关样本（配对样本）的平均数检验，如某一群被试参加自我效能训练方案前后的两次得分的自我效能平均数的比较。【2】

2. 单尾与双尾检验

当研究者只关心单一一个方向的比较关系时（如男生的数学成绩X₁优于女生X₂），平均数的检验仅有一个拒绝区，需使用单尾检验（one-tailed test）。当研究者并无特定方向的设定（如男生的智商与女生的智商有所不同），假设检验在两个阶段的情况下皆有可能发生，而必须设定两个拒绝区，此时即需要使用双尾检验（two-tailed test）。【2】

采用单尾检验必须提出支持证据，除非理论文献支持单侧的概念，或是变量间的关系具有明确的线索显示必须使用单侧检验，否则需采用双侧检验来检验平均值的特性。

（三）t检验的基本假设

1. 正态性假设（assumption of normality）

当样本数量不足时，抽样分布即无法符合正态性分布的要求，使得假设检验的理论根据失效。双样本平均数检验中，两个平均数来自两个样本，除了样本本身的抽样分布须为正态化之外，两个平均数的差的抽样分布也必须符合正态分布。正态性的违反，会导致整个统计检验的失效，所得的结果偏失不可信。 通常使用Shapiroe-Wilk test进行正态分布假设检验。【2】

2. 方差同质性（齐性）假设（homogeneity of variance）

独立样本t检验的功能在于比较不同样本的平均数差异，每一个正态化样本的平均数要能够相互比较，还必须具有相似的离散情况，也就是样本的方差必须同质性（齐性），称为样本方差同质性。方差同质性假设若不成立，会使得平均数的比较存有混淆因素。
两个独立样本方差同质性假设是否违反，可以利用Levene's test of homogeneity，以方差分析（F检验）的概念，计算两个样本方差的比值。若F检验达到显著水平，表示两个样本的方差不同质，此时需要校正公式来计算t值。 方差不齐的独立样本平均数差异的显著性检验可以用t'检验。【2】

（四）效应量（effect size）

效应量（effect size）是指自变量对因变量的影响力强度。最直观的效应量指标，是取平均数的差异量。平均数间差异越大，表示自变量的强度越强，称为d量数（Cohen，1988）。【3】

Weak |d| < 0.2;
Weak to moderate: 0.2 < |d| < 0.4;
Moderate: 0.40 < |d| < 0.65;
Moderate to strong: 0.65 < |d| < 0.8;
Strong: 0.8 < |d|.

参考文献

[1] 王孝玲. 教育统计学[M]. 上海：华东师范大学出版社, 2014: 108-118.

[2]邱皓政著 . 量化研究与统计分析：SPSS（PASW）数据分析范例解析[M]. 重庆大学出版社，2019:143-150.

[3] Rubin A. (2012). Statistics for evidence-based practice and evaluation. Cengage Learning.

[4] 杜晓新. 心理与教育研究中实验设计与SPSS数据处理. 北京: 北京大学出版社, 2013:15-28.

回复：配对和独立样本t检验- paired samples & independent samples t-test

马红亮 - 2021年11月8日星期一 21:25

二、数据分析实例

1. 单样本t检验（one-sample t-test）

Ameloot, E. , Rotsaert, T. , & Schellens, T. . (2021). The supporting role of learning analytics for a blended learning environment: exploring students' perceptions and the impact on relatedness. Journal of Computer Assisted Learning,38(1),90-102. （对257名师范生开展了混合式教学，实验组采用学习分析，对照组不采用学习分析。对实验组前测的学习分析期望的均值与中间值3进行了单样本显著性差异检验，发现学生对混合情境下学习分析有较高的期望。）

2. 配对样本t检验（paired samples t-test）

Zhao,L. et al. (2022). Effect of different mind mapping approaches on primary school students’ computational thinking skills during visual programming learning. Computers & Education. 104445. （73名小学生的准实验研究，两组不同概念图使用方式的班级，用配对样本t检验分析了两个组的CT技能前后测的显著性差异）
Ma, HL et al (2021). Promoting pupils’ computational thinking skills and self-efficacy: a problem-solving instructional approach. Educational Technology Research and Development, 69(3):1599-1616.
《技术支持下的教师专业发展》：Kim, C. M. et al . (2015). Robotics to promote elementary education pre-service teachers' STEM engagement, learning, and teaching. Computers & Education, 91, 14-31. 浏览课程单元讨论（配对样本t检验, r效应量）
Dasgupta, C. , Magana, A. J. , & Vieira, C. . (2019). Investigating the affordances of a CAD enabled learning environment for promoting integrated stem learning. Computers & Education, 129, 122-142. 浏览课程单元讨论（配对样本t检验, d效应量）
Olmo-Muoz, J. D. et al. (2020) . Computational thinking through unplugged activities in early years of primary education. Computers & Education, 150. 浏览课程单元讨论（Mann-Whitney test和T检验有什么区别（非参数检验和参数检验））

3. 独立样本t检验（independent samples t-test）

Stöhr,C. et al. (2020). The polarizing effect of the online flipped classroom. Computers & Education,147,103789. 浏览文章论坛讨论1（方差齐性检验）讨论2 （t'检验）
Polat, E., et al.(2021). A comprehensive assessment of secondary school students' computational thinking skills. British Journal of Educational Technology.52,(2).（调查了328名5-6年级学生，用独立样本t检验分析了男女之间、5-6年级之间学生的CT表现和感知的差异）
Sun L.H., Hu, L.L.,& Zhou, D.H. (2022).Programming attitudes predict computational thinking: Analysis of differences in gender and programming experience. Computers & Education,181.（调查了1180名初中生的CT技能（测验得分）与编程态度，用独立样本t检验，分别分析了男女生在CT技能和编程态度的差异情况；同时又对有编程经验和没有编程经验的学生在编程态度和CT技能方面的差异做了独立样本t检验。）

数据分析实例目录

配对和独立样本t检验- paired samples & independent samples t-test