马红亮的帖子

二、数据分析实例

1. Pearson相关

《STEM教育国际前沿专题》：Stöhr,C. et al. (2020). The polarizing effect of the online flipped classroom. Computers & Education,147,103789. 浏览文章论坛（Cross-correlation analysis）
Sun L, Hu L, Yang W, Zhou D, Wang X. (2021). STEM learning attitude predicts computational thinking skills among primary school students. Journal of Computer Assistted Learning. 37:346–358
Sun L.H., Hu, L.L.,& Zhou, D.H. (2022).Programming attitudes predict computational thinking: Analysis of differences in gender and programming experience. Computers & Education,181.（调查了1180名初中生的CT技能（测验得分）与编程态度，计算了两者之间的Pearson相关系数，以及编程态度5个因子与CT的相关系数。）
Chang, D., Hwang, GJ., Chang, SC. et al. (2021). Promoting students’ cross-disciplinary performance and higher order thinking: a peer assessment-facilitated STEM approach in a mathematics course. Educational Technology Research Development 69, 3281–3306.
Tsarava, K. (2022). A cognitive definition of computational thinking in primary education. Computers & Education, 179, 104425. （调查研究，分析了192名小学生CT认知能力与其他认知思维的相关性）
Polat, E., et al.(2021). A comprehensive assessment of secondary school students' computational thinking skills. British Journal of Educational Technology.52,(2).（调查了328名5-6年级学生，分析了CT表现和CT感知的相关性，数学成绩、IT成绩与CT表现的相关性等）

2. Spearman相关

Rozgonjuk, D., Kraav, T., Mikkor, K. et al. (2020). Mathematics anxiety among STEM and social sciences students: the roles of mathematics self-efficacy, and deep and surface approach to learning. International Journal of STEM Education 7, 46 .

如果一个研究涉及心理特质、能力与态度等抽象构念的测量，首要工作是通过标准程序来开发测量工具。如果研究者所测量的对象不是构念，而是一些客观事实和态度意见（如家里有几个未成年子女，对政府的施政满意不满意），研究者可以直接就每一个题的作答情形进行分析，而不用涉及所谓信度和效度的问题。

量表的编制程序与步骤

一、准备阶段

（一）文献整理与定向

如果要自行编制测量工具，必须依赖理论或文献的引导，协助研究者进行定向的工作。

（二）量表编制计划

一个量表编制计划通常包括量表的名称、目的与内容、对象、测量的格式与尺度、量表的长度与时间、预试施测计划、正式施测计划、信效度分析计划、常模建立、成本估计、时间流程等。

二、预试阶段

（一）题库编写

一般而言，初步量表题库题目需达到最后所需题数的数倍，经过逐步删减，成为最终的正式量表题目。题目编写有几点必须注意：第一，题目不易过长，以精简、易于阅读为原则。第二，题目必须适合适用对象的阅读与理解能力。第三，使用必要措施来应对填答者的特殊作答风格与反应心向。例如利用反向题来防止填答者的草率与恶意作答。

（二）预试（try-out）

预试多半使用立意抽样或便利抽样，建立一个小型样本，施以预试版本测验，以决定题目的可用程度，据以删除不良的题目，决定正式量表，这个过程称之为项目分析（item analysis）。预试样本300人是有一个可以努力达到的数字。

此外，预试也可以多种方式同时并行，例如将题目交给相关的学者专家或务实工作者，请其评估题目的优劣。通常，专家所评定的内容不仅是表面效度还有内容效度。

（三）项目分析

主要目的是针对预试题目进行适切性的评估。分为质的分析和量的分析。质的分析着重于题目的内容与形式的适切性讨论，量的分析主要指题目的难度与鉴别度的检验（如一般能力测验）。对于非认知测验（如人格测验与态度量表），则可以从各种量化的指标来检验项目的适切性。项目分析阶段，研究者得以剔除不良题目，提高量表的质量。

三、正式阶段

正式施测的目的在于进行信效度的评估，决定一个测验量表的整体可用程度，并得以建立常模。

四、维护阶段

量表的持续研究与维护工作，以提高量表的实用性。量表的另外一项工作，是持续发展余修订常模（norm），提高量表分数的使用价值。常模可以将受测者的分数轻易转换为相对分数（例如百分等级），获知相对的高低。

参考文献：

邱皓政著 . 量化研究与统计分析：SPSS（PASW）数据分析范例解析[M]. 重庆大学出版社，2013:294--298.

【2】DeVellis, R. (2017). Scale development(4th ed.), Sage, Los Angeles, CA .

案例分析

郭颖,樊富珉,张英俊,刘宇.团体咨询师胜任力量表的编制[J].心理与行为研究,2021,19(06):809-815.

在场景中看此帖

一、理论原理

（一）回归分析的概念

相关表示两个变量之间的双向相互关系。如果我们将存在相关的两个变量，一个作为自变量，另外一个作为因变量，并把两者之间不十分准确、稳定的关系，用数学方程式来表达，则可利用该方程由自变量的值来估计、预测因变量的估计值，这一过程称为回归分析。可见，回归表示一个变量随另外一个变量作不同程度变化的单向关系。在存在相关的情况下，相关越高，由一个变量值预测另外一个变量值越准确，误差越小。【1】

两个连续变量的共同变化的情形，称为共变（covariance），是连续变量关联分析的主要基础。在统计学上，涉及两个连续变量的关系多以线性关系的形式进行分析。线性关系分析是将两个变量的关系以直线方程式的原理来估计关联强度。……另一方面，回归分析则是运用变量间的关系来进行解释与预测的统计技术。在线性关系假设成立的情况下，回归分析是以直线方程式来进行统计决策与应用，又称线性回归（linear regression）。一般来说，两个变量的关系以相关系数去检验线性关联的强度，若相关达到统计显著水平，表示线性关系是有意义的，便可进行回归来进行进一步的预测与解释。【2】

（二）线性回归的特点

1. 线性回归的类型

（1）一元线性回归是指只有一个自变量的线性回归，表示两个变量（自变量和因变量）之间有直线函数关系。一元线性回归线可以有两条：以X为自变量、Y为因变量的回归线是一条，以Y为自变量、X为因变量的回归线是另一条。确定回归线的方程称为回归方程，通式为Y=a+bX，b为回归系数，Y为估计值。为了考察两个变量在总体内是否存在线性关系，以及回归方程对估计预测因变量的有效性如何，还需要进行显著性检验，如对回归系数进行显著性检验。【1】

（2）多元线性回归是指有两个或两个以上自变量的线性回归，在教育研究中某一种现象的变化往往由多种因素共同作用的结果，多元线性回归比一元线性回归的用途广泛。【1】

2. 标准化回归系数

标准化回归系数（standardized regression coefficient），称为β系数。由于标准化的结果，β系数的数值类似于相关系数，介于-1至+1之间，其绝对值越大，表示预测能力越强，正负向则代表X与Y的关系方向。【2】

3. 回归解释力

R²反映回归模型的解释力，即Y变量被自变量所消减的误差百分比。当R²为0时，表示自变量对因变量没有解释力；当R²为1时，表示自变量能够完全解释因变量的变异。值得注意的是，在回归分析中，研究者往往为了提高模型的解释力，不断投入解释变量，每增加一个自变量，则损失一个自由度，最后模型中无关的自变量过多，自由度太低，失去了简效性。调整后的R²（adjusted R²）反映了因为自变量数目变动而导致的简效性损失的影响。如果研究者的目的在比较不同模型的解释力大小，各模型的自变量数目的差异会造成简效程度的不同，宜采用调整后的R²。【2】

4. 回归系数的显著性检验

回归分析除了通过R²了解整个回归方程式的预测效果，个别的回归系数β则可以用于说明预测变量对因变量的解释力，其值的大小亦需经过假设检验（F检验）来证明其显著性。【2】

5. 回归分析的基本假设

回归分析（线性）进行变量关系的探讨，是基于某些统计假设之下的。当这些假设被违反时，将导致偏误的发生。回归分析的基本假设包括：固定自变量假设、线性关系假设、正态性建设、误差独立性假设以及误差等分散性假设。【2】

（三）回归的分析步骤

回归分析包括以下操作步骤：【3】

第一步：首先对模型情况进行分析

包括模型拟合（modle fit）情况(比如R ²为0.3,则说明所有自变量可以解释因变量30%的变化原因)，模型共线性问题(VIF值小于5则说明无多重共线性)，是否通过F 检验(F 检验用于判定是否X中至少有一个对Y产生影响，如果呈现出显著性,则说明所有X中至少一个会对Y产生影响关系)。

第二步：分析X的显著性

如果显著(p 值判断)，则说明具有影响关系（解释力具有统计上的意义），反之无影响关系。

第三步：判断X对Y的影响关系方向

回归系数β值大于0说明正向影响,反之负向影响。

第四步：其它

比如对比影响程度大小(回归系数β值大小对比X对Y的影响程度大小)。

参考文献：

[1] 王孝玲. 教育统计学[M]. 上海：华东师范大学出版社, 2014:229-240.
[2] 邱皓政著 . 量化研究与统计分析：SPSS（PASW）数据分析范例解析[M]. 重庆大学出版社，2013: 222-232.
[3] SPSSAU. 回归分析. https://spssau.com/helps/universalmethod/regression.html

在场景中看此帖

一、理论原理

（一）非参数检验的概念

假设检验的方法有两种：参数检验和非参数检验。Z、t、F检验都是参数检验，它们是根据样本的信息对相应的总体参数的假设检验。这种检验是以样本所属的总体呈正态分布，两个总体方差齐性为假定条件，适用于等距变量和比率变量的数据。

非参数检验不仅适用于非正态总体的名义变量和次序变量的数据，而且也适用于正态总体等距变量和比率变量的数据。它一般不要求样本所属的总体呈正态分布，不需要对两个总体方差做齐性的假设，计算简单，适合处理小样本数据，但其灵敏性和精确度不如参数检验。^[1]

非参数检验法从实质上讲，只是检验总体分布的位置（中位数）是否相同，所以对于总体分布已知的样本也可以采用非参数检验法，但由于它不能充分利用样本内所有的数量信息，检验的效率一般要低于参数检验方法。当满足下面两个条件之一时，可以用非参数检验代替均值差检验（参数检验）：[2]

没有采用定距尺度，但可以安排数据的顺序（秩）；
样本小且不能假设具有正态分布。

（二）非参数检验的类型

1. 符号秩次检验（Wilcoxon）

为了克服符号检验的缺点，Wilcoxon提出了既考虑差数符号，又考虑差数大小的符号秩次检验法。当比较两个相关样本的差异时，Wilcoxon符号秩次检验法，是将两个样本每对数据差的绝对值从小到大排列，并赋予每一个差数以秩次（等级），然后再给差数记上正、负号。如果两个样本无显著性差异，正秩和与负秩和应当相等或接近相等；如果正秩和与负秩和相差较大，两个样本有显著性差异的可能性较大。当样本容量n<25时，为小样本，可采用查表法进行符号秩次检验。当n>25时，为大样本，二项分布接近正态，可用正态发布近似处理。【1】

Wilconxon Signed-Rank test（威尔科克森符号秩检验），用来进行配对样本（comparison within each group) ）的非参数检验。如果两个数据样本来自同一对象的重复观察，则将它们匹配。使用Wilcoxon有符号秩检验，可以确定相应的数据总体分布是否相同，而无需假设它们服从正态分布。（例如对15个人的体重进行分析，再对几周后的体重数据进行分析）。用双列r相关系数（biserial r）计算效应量。
Wilcoxon rank-sum test，适用于组间比较（between-group comparison）。同样用双列r相关系数（biserial r）计算效应量。

2. 秩和检验（Mann-Whitney）

当比较两个独立样本的差异时，可以采用Mann-Whitney两个人提出的秩和检验方法，由称曼-惠特尼U检验。当两个独立样本容量n₁和n₂都小于10，称为小样本；当两个独立样本容量n₁和n₂都大于10，称为大样本。【1】

Mann-Whitney test（曼-惠特尼U检验），用来检验两组独立样本是否来自两组不同的样本。如果两个数据样本来自不同的总体，并且样本互不影响，则它们是独立的。使用Mann-Whitney-Wilcoxon检验，我们可以确定总体分布是否相同，而无需假设它们服从正态分布。

参考文献：

[1]王孝玲. 教育统计学[M]. 上海：华东师范大学出版社, 2014: 257-269.

[2]谢龙汉等. SPSS统计分析与数据挖掘（第3版）. 北京: 电子工业出版社，2017.

在场景中看此帖

三、数据实例分析

Chen, V., Sandford, A., LaGrone, M., et al (2022). An exploration of instructors' and students' perspectives on remote delivery of courses during the COVID-19 pandemic. British Journal of Educational Technology,55(3).（对71名教师和122名学生疫情期间的在线教学情况进行了问卷调查，首先进行了各种频次和百分比统计，接着对这些百分比进行了卡方检验，以说明是否存在显著性差异。）
Yoon, I., & Kim, M.(2022). Dynamic patterns of teachers’ professional development participation and their relations with socio-demographic characteristics, teacher self-efficacy, and job satisfaction. Teaching and Teacher Education, 109. （使用卡方检验对教师自我效能感、工作满意度在五类教师专业发展参与度群体方面，进行了平均值差异检验，并进行了不同类别大小显著性的比较）

在场景中看此帖

马红亮