马红亮的帖子

学习分析

Saqr, M. et al. (2023). Intense, turbulent, or wallowing in the mire: A longitudinal study of cross-course online tactics, strategies, and trajectories. The Internet and Higher Education，57,100902, https://doi.org/10.1016/j.iheduc.2022.100902 （在Moodle平台开展基于混合的问题式学习，对完成10门课程学习的135名大学生的平台追踪数据，进行了深度挖掘和分析，揭示了三类长期学习策略）

在场景中看此帖

易用性

Kamaghe, J., Luhanga, E., & Kisangiri, M. (2020). The Challenges of Adopting M-Learning Assistive Technologies for Visually Impaired Learners in Higher Learning Institution in Tanzania. International Journal of Emerging Technologies in Learning (iJET), 15 (1)，140-151. https://doi.org/10.3991/ijet.v15i01.11453 （调查了坦桑尼亚视觉障碍大学生对移动辅助技术的感知、使用水平以及面临的挑战）

在场景中看此帖

三、开放问题数据分析实例

Boesdorfer, S.B., Del Carlo, D.I. & Wayson, J.(2022). Secondary Science Teachers’ Definition and Use of Data in Their Teaching Practice. Research in Science Education, 52, 159–171. （研究了美国451名科学教师有关数据驱动教学的问卷数据，其中包括3道开放型问题的数据。对质性数据，每位研究者分别阅读一个问题的所有回答，然后归纳出初始的编码方案及相应的定义，接着讨论产生该问题的综合编码方案。其中需要明确界定每个编码以及形成研究者之间的共识。单独对每个问题进行编码之后，再比较三个问题的编码目录及其定义，寻找相似之处和其中的模式。最终整合的编码、定义作为基础的主题，用来回答所研究的问题。）
Mouza, C., Codding, D. M., & Pollock, L. (2022). Investigating the impact of researchbased professional development on teacher learning and classroom practice: Findings from computer science education. Computers & Education.（对94名计算机教师后测问卷中的2道开放题进行了开放编码，共进行了2轮，给出了Parent Code和Child code的定义以及摘录案例。）
Ung, L-L. et al. (2022). Computational thinking for teachers: Development of a localised E-learning system. Computers & Education,177. （设计开发了旨在提高教师CT教学的myCTGWBL数字化学习系统，共369名教师参与了干预的前测和后测，其中测试包括了多项开放问题。研究者应用简单的文本分析技术对这些开放问题进行了分析，包括类别和对应回答者数量，并进行了前后测的对比分析。）
Ma, H., & Green, M. (2023).A longitudinal study on a place-based school-university partnership: Listening to the voices of in-service teachers.Teaching and Teacher Education, 129, 104148. https://doi.org/10.1016/j.tate.2023.104148

在场景中看此帖

一、理论原理

如果一个研究涉及心理特质、能力与态度等抽象构念的测量，首要工作是通过标准程序来开发测量工具。如果研究者所测量的对象不是构念，而是一些客观事实和态度意见（如家里有几个未成年子女，对政府的施政满意不满意），研究者可以直接就每一个题de [1]

（一）效度（validity）

1. 效度的概念

效度即测量的正确性，指测验或其他测量工具确实能够测得其所欲测量的构念（construct）之程度，亦即反映测验分数的意义为何。一般使用的效度评估方法，主要有判断法（informed judgment）与实证法（gathering of empirical evidence）两个策略，前者着重于测量特性与质量的评估，通常依赖于研究者的主观判断；实证法则根据具体客观的量化指标进行效度的评估。[1]

2. 效度的类型[1]

内容效度（content validity）反映测量工具本身内容范围与广度的适切程度。内容效度的评估，需针对测量工具的目的和内容，以系统的逻辑方法来分析，又称为逻辑效度。
表面效度（face validity），指测量工具在外显形式上的有效程度，为一群评判者主观上对于测量工具形式上有效程度的评估。内容效度强调测量内容的广度、涵盖性与丰富性，以作为外在推论的主要依据，表面效度则重视工具的外显的有效性，两者具有相辅相成之效。
构念效度（construct validity），指测量工具能测得一个抽象概念或特质的程度。构念效度的检验，必须建立在特定的理论基础之上，通过理论的澄清，引导出各项关于潜在特质或行为表现的基本假设，并以实证方法检验测量结果是否符合理论假设。一种与构念效度有直接关系的效度为因素效度（factorial validity），也就是一个测验或理论背后的因素结构的有效性。

3. 效度的检验

传统上用来评估测验效度的技术主要包括相关分析、回归分析、因素分析、多重特质多重方法矩阵分析（MTMM）等。近年来，结构方程模型（SEM）在效度检验方面运用日益广泛。因素分析（factor analysis）已经成为量表编制过程中不可或缺的工具，主要用来进行构念效度的验证。因素分析分为探索性因素分析和验证性因素分析。[1]

探索性因素分析（exploratory factor analysis，EFA），主要被用来寻找一组变量背后潜藏的因素结构与关系。（1）KMO（介于0-1之间）值越大，表示变量间（题项间）的共同因素越多，Bartlett’s球形检验达到0.05显著水平，说明适合做因素分析。（2）采用主成分分析法抽取主成分（共同因素）时，通常考虑初始特征值大于1的成分，特征值大于1的因素数量即为所抽取的共同因素的个数。此外，还需要考虑因素陡坡图，取坡线突然剧升的因素，删除坡线平坦的因素。至于保留多少个共同因素，还需要参考所抽取的共同因素是否有合理性，即共同因素（每个构念）包含的题目变量最少在三题以上，题目变量所要测量的潜在特质类似且因素可以命名。（3）采用最大变异法（Varimax）进行转轴后可以得到转轴后的成分矩阵，题项按因素载荷量的高低排列（大于0.4），矩阵表中的系数可视为变量与因素的相关系数矩阵。此时需要删除题项不足3个的因素，因素载荷在不同因素均小于0.4的题项，以及因素载荷在多个因素的载荷大于0.4的题项。（4）删除因素和题项后需要重新进行探索性因子分析。[3]
验证性因素分析（confirmatory factor analysis, CFA）。如果在研究之初就已经提出某种特定的结构关系的假设，例如某一个概念的测量问卷由数个不同子量表组成时，此时因素分析可以被用来确认数据的模式是否就是研究者所预期的形式，称为验证性因素分析。在技术层面，CFA是结构方程模型的一种次模型。

（二）信度（reliability）

信度即是测量的可靠性，是指测量结果的一致性或稳定性。

1. 内部一致性信度

在计算测验信度时，如果直接计算测验题目内部之间的一致性，作为测验的信度指标时，称为内部一致性（coefficient of internal consistency）。

KR20与KR21信度。库里信度（Kuder-Richardson reliability）是Kuder & Richardson（1937）提出的适用于二分题目的信度计算方法。KR20适用于各题难度不同。如果将每个题目难度都假设相同，或者研究者不重视试题难度的差异，而将试题难度设定为常数，可以用KR21来计算内部一致性系数。KR20与KR21适用于二分变量的测验类型（例如能力测验与教育测验）。
Cronbach's a。社会与行为科学研究中，多数测量不是对错二分的测量，而多以评定量尺作为测量工具，因此Cronbach（1951）将KR20加以修改，得到a系数。α ＞ 0.8 表示问卷的信度良好，0.7＜ α ＜ 0.8 表示问卷的信度可以接受( Blunch，2010)。

2. 评分者间信度

当测量的进行使用的工具是“人”，而非量表之时，不同的评价者可能打出不同的分数，分数误差变异的来与是评分者间的差异，若计算各得分的相关，即是评分者间信度（inter-rater reliability）。评分者间信度所反映的试不同的评分者在测验过程中进行观察、记录、评分等各方面的一致性。相关度越高，表示量表的信度越高。[1]

（三）项目分析

1. 项目难度

项目难度（item difficulty）是指一个测验的试题对受测者能力水平的反映程度，主要适用于能力测验或教育测验的项目评估。

在一个对错二分的题项下，项目难度通常以所有受测者在该项题目上正确回答的百分比来表示。一个测验题目的难度以0.5为宜，此时全体受测者的分数居中，分布呈现正态。【1】
每个题项的权重分数为该题项的难度系数乘以原始得分，整个测验的权重分数为所有题项的权重分数之和，而不是原始分数的简单相加。【5】
如果是人格与态度测量（Likert量表），此时最适合作为难度指标的试题目的平均数，平均数过高或过低，代表题目过于偏激或冷涩，导致全体受测者均回答出类似的答案。【1】

2. 项目区分度

项目区分度（item discrimination）反映测验题目能够正确测得受测特质的内容的程度，并能够鉴别个别差异的能力，一般用区分度指数（discrimination index,DI），也用相关系数来反映项目区分度。

通常做法是，将受测者的得分依照高低顺序排列，然后选出最高分（前27%）与最低分（后27%）的两群人，称为效标组。然后比较每一个题目在这两个校标组的平均得分，通过t检验分析是否达到显著的差距，称为极端组比较法。在使用t检验时，多采用a=0.01。【1】
DI指数是指高分组和低分组的正确率之差除以样本数量，当DI≥0.4，表示区分度良好；0.3≤DI≤0.39，表示区分度较好；0.2≤DI≤0.29，表示区分度介于边界；DI≤0.19，表示区分度比较差。【4】

参考文献

[1] 邱皓政著 . 量化研究与统计分析：SPSS（PASW）数据分析范例解析[M]. 重庆大学出版社，2019: 301-315.
[2] SPSS. 验证性因子分析（CFA）. https://spssau.com/helps/questionnaire/cfa.html
[3] 吴名隆. 问卷统计分析务实——SPSS操作与应用[M]. 重庆大学出版社,2010: 216-226.
[4] Ebel, R. L., & Frisbie, D. A. (1972). Essentials of educational measurement. Prentice-Hall.
[5] Yaşar, M., Kartal, S., & Aybek, E. C. (2021). Scoring methods for multiple choice tests: How does the item difficulty weighted scoring change student's test results? Bartın University Journal of Faculty of Education, 10(2), 309–324.

在场景中看此帖

二、数据分析实例

（一）方差分析（ANOVA）

1. 单因素方差分析（one-way ANOVA）

Makransky, G. , Borre-Gude, S. , & Mayer, R. E. . (2019). Motivational and cognitive benefits of training in immersive virtual reality based on multiple assessments. Journal of Computer Assisted Learning, 浏览课程单元讨论（研究者对三组（Text /Desktop VR/Immersive VR）喜欢程度的后测进行了单因素方差分析（ A one-way between-subject ANOVA），发现有显著差异（F(2, 102) = 18.93, p < .001.）。接着应用Dunnett's test进行POST hoc分析，两两比较发现，Immersive VR组和Desktop VR组都要比text组显著高。）

Sun L.H., Hu, L.L.,& Zhou, D.H. (2022).Programming attitudes predict computational thinking: Analysis of differences in gender and programming experience. Computers & Education,181.（对175名有编程经验的初中生，分别从首次学习编程的年级、学习编程的持续年限，运用单因素方差分析，分析了编程态度和CT技能的在这两个维度方面是否有显著性差异。）

2. 重复测量方差分析（Repeated Measures ANOVA）

Kwon, K., Ottenbreit-Leftwich, A.T., Brush, T.A. et al. (2021). Integration of problem-based learning in elementary computer science education: effects on computational thinking and attitudes. Educational Technology Research and Development, 69, 2761–2787. （在4所小学200名6年级学生中，开展PBL编程教育的准实验研究，对前测、后测1和后测2中的每一个CT概念（共6个）分别进行了重复测量方差分析，分析了随时间变化学生每一个CT概念受实验干预的变化增量（learning gain））
Kong, S. & Lai, M. (2022).Effects of a teacher development program on teachers' knowledge and collaborative engagement, and students' achievement in computational thinking concepts. British Journal of Educational Technology, （对81名中小学教师进行了为一起1年的培训，采用单组前后测实验设计，运用重复测量方差分析，分析了教师学科知识测验的主效应以及交互效应。）

3. 二因素方差分析（two-way ANOVA）

Luo, H. et al. (2022). Impact of role assignment and group size on asynchronous online discussion: An experimental study. Computers & Education.104658.(采用2*2因素设计实验设计，自变量为角色分配（是/否）、小组大小（小/中），因变量异步论坛讨论中的参与行为（分5个子维度）、学习经验以及学习成就，对角色分配和小组大小在论坛参与行为的效果进行了双因因素分析。)

Jiang, S., & Wong, G.K.W. (2022). Exploring age and gender differences of computational thinkers in primary school: A developmental perspective. Journal of Computer Assisted Learning, 1,(38),60-75. （RQ1：对小学生实验前的CT前测进行年级和性别的两因素方差分析，发现年龄有显著差异，性别和性别与年龄的交互作用均没有显著差异。接着用Bonferroni事后检验发现，6年级与4年级、5年级有显著差异。）
Polat, E., et al.(2021). A comprehensive assessment of secondary school students' computational thinking skills. British Journal of Educational Technology.52,(2).（调查了328名5-6年级学生，用两因素方差分析，发现性别和年级对计算思维技能和自我效能感的总体交互作用不显著，接着用独立样本t检验）

4. 三因素方差分析（three-way ANOVA）

Jiang, S., & Wong, G.K.W. (2022). Exploring age and gender differences of computational thinkers in primary school: A developmental perspective. Journal of Computer Assisted Learning, 1,(38),60-75. （RQ2+RQ3：对小学生实验的CT进行年龄（3组）、实验条件（实验和对照组）以及测试时间（前测和后测）进行三因素方差分析，年龄和实验条件是组间因素（被试间变量），测试时间是组内因素（被试内变量），结果发现测试时间和条件有交互作用；还发现年龄和实验条件的交互作用明显。）

4. 多变量方差分析（multivariate analysis of variance，MANOVA）

Kwon, K., Ottenbreit-Leftwich, A.T., Brush, T.A. et al. (2021). Integration of problem-based learning in elementary computer science education: effects on computational thinking and attitudes. Educational Technology Research and Development, 69, 2761–2787. （在4所小学200名6年级学生中，开展PBL编程教育的准实验研究，分别对前测、后测1和后测2中的6种CT概念（6个因变量）进行了MANOVA分析。使用Wilks统计分析了6种CT概念在每次测试中的总体差异情况和效应量（𝜂²），以及使用单独单变量检验（Separate univariate tests）分析6种CT概念相互之间的高低关系。）

在场景中看此帖

马红亮