Posts made by 红亮 马

数据分析实例 -> 数据分析实例目录 -> 访谈数据分析

by 红亮 马 -

一、理论原理

(一)访谈的概念

      访谈是质性研究中最重要的一种收集资料的方式。访谈不是一个一方“客观”地向另一方了解情况的过程,而是一个双方相互作用、共同构建“事实”和“行为”的过程。在访谈进行的时候,双方实际上是在相互探询、相互博弈、相互协调。双方的个人身份和相互关系都会影响到访谈的风格和进程,交谈双方实际上是在一起营造访谈的氛围和话语情境。【1】
      在使用观察、问卷或实物分析的同时,使用访谈还可以起到相关检验研究结果的作用。例如,与实物分析相比,访谈更具灵活性、即时性和意义解释功能访谈者可以在与受访者交流的时候询问他们的看法,了解他们对自己创造的实物的意义解释,探询这些实物与他们生活中其他事件直接的关系。【1】

(二)访谈的类型

      质的研究中,访谈主要指开放型访谈和半开放型访谈。根据受访者的人数,访谈可以分为个别访谈(一对一)和集体访谈(1-3名访谈者和6-10名参与者)。根据访谈的次数,访谈可分为一次性访谈(收集事实性信息)和多次性访谈(追踪调查、深入探究某些问题)。 虽然访谈的形式多种多样,对访谈形式的选择依据研究的问题、目的、对象、情境和研究阶段不同有所不同,在必要时可以结合不同的方式。焦点小组(团体)访谈是集体访谈中最常见的一种方式。【1】

(三)访谈的注意事项

    1.目的性抽样

     质性研究一般采用“非概论抽样”方式,使用最多的是“目的性抽样”,即按照研究的目的抽取能够为研究问题提供最大信息量的研究对象。目的性抽样按照样本特性可以分为:极端个案或偏差型个案抽样、强度抽样(较高信息密度和强度的个案)、最大差异抽样、同质性抽样典型个案抽样分层目的型抽样、关键个案抽样、效标抽样(criterion sampling,按设定标准选择个案)、证实和伪证个案抽样。【1】

    2. 访谈提纲

    访谈提纲应该是粗线条的,列出访谈者在访谈中应该了解的主要问题和应该覆盖的内容范围。访谈提纲应该尽可能简洁明了,最好只有一页纸,可以一眼就全部看到。访谈提纲应该随时进行修改,前一次(或者是对前一个受访者)访谈的结果可以作为下一次(或是对下一个受访者)的访谈设计提供依据。【1】

      在质的访谈中,访谈者除了应该尽量使用开放型(以什么、如何和为什么为主线)、具体型和清晰型问题以外,还需要有意识地使用追问这一手段,对有关问题进行深入的探讨。【1】

(四)编码

    1. 分段与编码
    分段(segmenting)就是把数据分解成有意义的分析单位。一个有意义的文本单位可能是一个词、一个单独的句子、几个句子,也可能是一个段落或文档。编码(coding)就是把数据段标上符号、描述性词语或类别名称(类别标签)的过程。在编码期间,随着新编码的形成,如果它们尚未列入清单,有必要把它们添加到编码的总清单(master list)上。编码过程有编码者间信度(intercoder reliability),即不同编码者的一致性;也有编码者内部信度(intracoder reliability),即每个单一编码者的一致性。【4】

    2. 归纳编码和先验编码
     归纳编码(inductive codes)指研究者在编码过程中,通过直接检验数据而形成的编码,这种编码以客位术语(参与者自己所使用的术语)为基础。先验编码(priori codes),也称预先编码,指研究者按照一个已经定好的编码方案进行编码,这种编码常用于试图重复或扩展某个先前的研究。研究者可以在数据收集之前,基于与研究问题的相关性,建立一些先验编码。在实践中,许多研究者既会采用预先编码,也会采用归纳编码。 【4】 

    3. 点查

    点查(enumeration)是指词语或编码类别在数据中出现的频率,是一种对质性数据进行量化的过程,它可以传达一些诸如“数量”或“频率”的概念。列出频率也有助于识别数据中突出的主题。然而,一个词语出现的频率较高,或许仅仅是因为一个或两个研究参与者多次使用了这个词,而不是因为有许多不同的参与者使用了这个词。【4】 

    4. 创建分层分类系统
    分类是定性数据分析的基本构建模块,因为研究者通过识别和研究数据中出现的类别来理解这些数据。在对数据进行编码之后,研究者往往关注由分类系统所展现的主题和关系。定性研究中的常见语义关系有包含关系、空间分布、因果关系、基本原理、功能关系、顺序关系、手段-目的、归属关系等等。在分析定性数据的类别关系时,可以通过把两个或多个维度交叉分类来获取一些新的、有趣的信息。定性分析通常使用绘图(diagramming)来展现不同分类之间的关系。【4】

(五)扎根理论

     1. 扎根理论的特点
      研究者在研究开始之前一般没有理论假设,直接从原始资料中归纳出概念和命题,然后上升到理论。这是一种自下而上建立理论的方法,即在系统收集资料的基础上,寻找反映现象的核心概念,然后通过在这些概念之间建立起联系而形成理论。【1】
      研究的目的是生成理论,而理论必须来自经验资料(empirical data);研究是一个针对现象系统地收集和分析资料,从资料中发现、发展和检验理论的过程。扎根理论研究人员喜欢分析胜过描述,喜欢新鲜的概念类别(category)胜过预先设定的观点,喜欢系统聚焦的、连续收集的资料胜过大量同时收集的资料(Charmaz,2006)。【2】

    2. 扎根理论的操作程序
     扎根理论的主要操作程序如下:(1)对资料进行逐级编码,从资料中产生概念;(2)不断地对资料和概念进行比较,系统地询问与概念有关的生成性理论问题;(3)发展理论性概念,建立概念与概念之间的联系;(4)理论性抽样,系统地对资料进行编码;(5)建构理论,力求获得理论概念的密度、变异度和高度的整合性。【1】
    3. 三级编码
      对资料进行逐级编码是扎根理论中最重要的一环,其中包括三个级别的编码:【1】
  • 一级编码——开放式编码(open coding)。编码的目的是从资料中发现本土概念(被研究者的话语,不等同于语词),对码号(code)加以命名。开放式编码开始时编码比较宽,编码越细致越好,随后不断地缩小范围,直到码号达到饱和。
  • 二级编码——轴心式编码(axial coding),又称关联式编码。主要任务是发现和建立概念类属之间的各种关系,这些联系可以是因果关系、类型关系、结构关系、功能关系、过程关系、策略关系等。
  • 三级编码——选择式编码(selective coding),又称核心式编码。在所有发现的概念类属中经过系统分析以后选择一个“核心类属”,将分析集中到那些与该核心类属有关的编码上。核心类属应该具有统领性,能够将大部分研究结果囊括在一个比较宽泛的理论范围之内。
【3】
    4. 不断比较的方法
      扎根理论的主要分析思路是比较,在资料和资料之间、理论和理论之间不断进行对比,然后根据资料与理论之间的相互关系提炼出有关的类属及其属性。这种比较通常有四个步骤:(1)根据概念的类别对资料进行比较;(2)将有关概念类属与它们的属性进行整合,同时对这些概念类属进行比较;(3)勾勒出初步呈现的理论,并将初步的理论返回到原始资料进行验证,优化现有理论,确保理论可以解释大部分原始资料;(4)对理论进行陈述。【1】

    5. 撰写备忘录
      Glaser认为,概念的产生和发展都需要通过备忘录的撰写,一旦有想法就停止编码,撰写备忘录。尽管开放编码可以快速产生许多代码,但需要经常停止编码,通过撰写备忘录来记录想法,因为此时研究人员脑海中关于数据的想法是最新鲜的,撰写备忘录可以让研究人员看清楚下一步需要做什么,进而促进理论性抽样。即便是最后的论文写作,也是对备忘录的系统整理。【2】

(六)定性数据分析软件

      1.  MAXQDA是一种定性、定量和混合方法的数据分析工具。它可以让你输入各种来源的数据,比如调查、访谈和焦点小组等等,从文本到图像、音频/视频文件、网站、推文、焦点小组讨论、调查回复等等。用户可以对这些数据进行标记和分类,以便进行分析。
      2.  NVivo与MAXQDA一样,它允许用户组织和存储定性数据,以便进行分析。您还可以导入word文档、PDF、音频、图像和视频。

   
参考文献
[1]陈向明. 质的研究方法与社会科学研究[M].北京:教育科学出版社,2000:103-116;165-181;182-194;318-338.
[3] Saldana, J. (2013). The coding manual for qualitative researchers. (2nd Ed.) Thousand Oaks: SAGE
[4] 伯克·约翰逊,拉里·克里斯滕森 著,马健生 等译.  教育研究:定量、定性和混合方法(第4版)[M]. 重庆:重庆大学出版社,2015:480-506.

(五)多重比较:事前与事后检验

      当方差分析F检验值达到显著水平,表示至少有两组平均数之间有显著性差异存在。但究竟是哪几个平均数之间显著有所不同,必须进一步进行多重比较(multiple comparison)来检验。如果多重比较在F检验之前进行,称为事前比较(priori comparisons),在获得显著的F值之后进行的多重比较,称为事后比较(posteriori comparasions)。【1】

     在事后比较(也称Post Hoc Comparison)方面:【1】

(1)未违反方差同质(Equal Variance Assumed)假定的多重比较方法有(按从最敏感到最保守的顺序排列):

  • LSD法(Least-significant difference),与t检验原理类似,以平均数差异的检验为主要策略,缺点是并没有因为是多次的比较而调整检验的观察显著水平(p),是比较粗糙的多重比较程序。
  • LSD法、HSD法(Tukey)、Newman-Keuls法(S-N-K)均适用于每一组样本人数相同的情况。但当各组人数不相等时,每次比较的检验力则有所不同。
  • Scheffe's method,与上述其它多重比较方法不同,该方法提出以F检验为基础的n不相等(各组人数不相等)的多重比较技术。由于直接采用F检验,因此Scheffe法无须其他的查表程序,使用上非常方便。Scheffe检验可以广泛地适用于成对比较以及各种复杂比较。

 (2)违反方差同质(Equal Variance Not Assumed)假定的多重比较方法有:

  • Dunnett's T3法,样本数不同最有可能的影响是造成违反方差同质假设,此时可以采用Dunnett(1980)的T3法来处理。……值得注意的是,ANOVA在各组方差不同质,也就是违反方差同质性假设时,并不会对F检验进行校正,此时需采用校正程序来进行各平均数的事后比较,才能处理方差不同质所造成的对平均数比较的影响,此时建议使用Dunnett的T3法。
参考文献
   【1】邱皓政 著 . 量化研究与统计分析:SPSS(PASW)数据分析范例解析[M]. 重庆大学出版社,2019:158-167.


一、理论原理

    t检验分独立样本t检验和配对样本t检验,经常用于单组前后测实验设计(配对样本)和双组前后测实验设计(独立样本)、双组延时实验设计(独立样本)的平均值差异显著性检验中。【4】

(一)相关样本和独立样本

    1. 相关样本
    两个样本内个体之间存在着一一对应的关系,这两个样本称为相关样本。相关样本有两种情况:【1】
  • 用同一个测验对同一组被试在实验前后进行两次测验,所获得两组测验结果是相关样本。
  • 估计某些条件基本相同的原则,把被试一一匹配成对,然后将每对被试随机地分入实验组和对照组,对两组被试施行不同的实验处理之后,用同一个测验所获得的测验结果,也是相关样本。
   2. 独立样本
      在教育研究中,对同一组被试在实验前后施以同一个测验,有时会产生两次测验的效应。而挑选条件相同的对象,进行配对比较,也较为困难。因此在实际应用时,经常利用独立样本对总体平均数的差异进行检验。两个样本内的个体是随机抽取的,它们之间不存在一一对应的关系,这样的两个样本称为独立样本。【1】一般来说,如果是独立样本,则需要对两样本进行方差齐性(同质性)检验相关样本则被认为是基本同质的,只进行相关检验(correlation)。【4】

      两个样本容量都大于或等于30的独立样本称为独立大样本;两个样本容量都小于30,或其中一个小于30的独立样本称为独立小样本。

(二)t检验的概念和类型

    1. t检验的概念
      连续变量的测量数据,适合以描述统计的集中趋势量数与离散量数来描绘观察结果。连续变量的分析与检验,通常与平均数与方差的检验有关。
      在平均数检验方法中,总体的标准差是否已知,有不同的处理模式:当总体的标准差已知时,进行Z检验;当总体标准差未知时,需要使用t检验。一般而言,总体的标准差多无法得知,因此使用Z检验的机会并不多另一方面,由于t分布随着自由度的改变而改变,当n大于30时,t分布于Z分布十分接近。使用t检验其实涵盖了Z检验的应用。在数据分析实务中,多以t检验来进行单样本的平均数检验或平均数的差异检验。
      t检验有单总体平均数检验(某大学一年级新生的平均年龄19.2岁是否与全国大一新生的平均年龄18.7岁相同),双总体平均数检验(独立样本与相关样本)。独立样本的平均数检验,如某大学一年级新生男生的平均年龄21.2岁,是否与女生的平均年龄19.7岁相同。相关样本(配对样本)的平均数检验,如某一群被试参加自我效能训练方案前后的两次得分的自我效能平均数的比较。【2】

     2. 单尾与双尾检验
      当研究者只关心单一一个方向的比较关系时(如男生的数学成绩X1优于女生X2),平均数的检验仅有一个拒绝区,需使用单尾检验(one-tailed test)。当研究者并无特定方向的设定(如男生的智商与女生的智商有所不同),假设检验在两个阶段的情况下皆有可能发生,而必须设定两个拒绝区,此时即需要使用双尾检验(two-tailed test)。【2】
     采用单尾检验必须提出支持证据,除非理论文献支持单侧的概念,或是变量间的关系具有明确的线索显示必须使用单侧检验,否则需采用双侧检验来检验平均值的特性。

(三)t检验的基本假设

    1. 正态性假设(assumption of normality)

    当样本数量不足时,抽样分布即无法符合正态性分布的要求,使得假设检验的理论根据失效。双样本平均数检验中,两个平均数来自两个样本,除了样本本身的抽样分布须为正态化之外,两个平均数的差的抽样分布也必须符合正态分布。正态性的违反,会导致整个统计检验的失效,所得的结果偏失不可信。  通常使用Shapiroe-Wilk test进行正态分布假设检验。【2】

   2. 方差同质性(齐性)假设(homogeneity of variance)

       独立样本t检验的功能在于比较不同样本的平均数差异,每一个正态化样本的平均数要能够相互比较,还必须具有相似的离散情况,也就是样本的方差必须同质性(齐性),称为样本方差同质性。方差同质性假设若不成立,会使得平均数的比较存有混淆因素。
      两个独立样本方差同质性假设是否违反,可以利用Levene's test of homogeneity,以方差分析(F检验)的概念,计算两个样本方差的比值。若F检验达到显著水平,表示两个样本的方差不同质,此时需要校正公式来计算t值。 方差不齐的独立样本平均数差异的显著性检验可以用t'检验。【2】  

(四)效应量(effect size)

    效应量(effect size)是指自变量对因变量的影响力强度。最直观的效应量指标,是取平均数的差异量。平均数间差异越大,表示自变量的强度越强,称为d量数(Cohen,1988)。【3】
  • Weak |d| < 0.2;
  • Weak to moderate: 0.2 < |d| < 0.4;
  • Moderate: 0.40 < |d| < 0.65;
  • Moderate to strong: 0.65 < |d| < 0.8;
  • Strong: 0.8 < |d|.

参考文献
[1]  王孝玲. 教育统计学[M]. 上海:华东师范大学出版社, 2014: 108-118.
[2]邱皓政 著 . 量化研究与统计分析:SPSS(PASW)数据分析范例解析[M]. 重庆大学出版社,2019:143-150.
[3] Rubin A. (2012).  Statistics for evidence-based practice and evaluation. Cengage Learning.
[4] 杜晓新. 心理与教育研究中实验设计与SPSS数据处理. 北京: 北京大学出版社, 2013:15-28.

  • Kelley, T.R., Knowles, J.G., Holland, J.D. et al. (2020). Increasing high school teachers self-efficacy for integrated STEM instruction through a collaborative community of practice. International Journal of STEM Education, 7. https://doi.org/10.1186/s40594-020-00211-w
  • Brand, B.R. (2020). Integrating science and engineering practices: outcomes from a collaborative professional development.International Journal of STEM Education, 7. https://doi.org/10.1186/s40594-020-00210-x

    论文对6个假设中的3和5,进行了单因素被试间的协方差分析(A one‐way between‐subject analysis of covariance,ANCOVA)

3.4 Hypotheses 2a and 2b: Did the VR groups have higher pretest-to-posttest changes in intrinsic motivation than the text group?

    研究者为了验证两个VR组对学生内在兴趣的提升要显著高于文本组,进行了单因素协方差分析( one-way between-subject analysis of covariance (ANCOVA)),即将前测内在兴趣分数作为协变量( covariate),后测兴趣分数作为因变量(dependent variable),结果显示三组有显著差异(F(2, 100) = 7.249, p = 0.001)。接着进行两两比较,发现immersive VR比文本组要显著高(F(1, 65) = 8.995, p = 0.004),desktop VR 组也要比文本组要显著高(F(1, 68) = 10.919, p = 0.002)。


3.5 Hypotheses 3a and 3b: Did the VR groups have higher pretest-to-posttest changes in self-efficacy than the text group?

        研究者做了与3.4相同的数据统计分析。

    那么单因素协方差分析检验是什么?有什么特点?