访谈数据分析

访谈数据分析

by 红亮 马 -
Number of replies: 2

一、理论原理

(一)访谈的概念

      访谈是质性研究中最重要的一种收集资料的方式。访谈不是一个一方“客观”地向另一方了解情况的过程,而是一个双方相互作用、共同构建“事实”和“行为”的过程。在访谈进行的时候,双方实际上是在相互探询、相互博弈、相互协调。双方的个人身份和相互关系都会影响到访谈的风格和进程,交谈双方实际上是在一起营造访谈的氛围和话语情境。【1】
      在使用观察、问卷或实物分析的同时,使用访谈还可以起到相关检验研究结果的作用。例如,与实物分析相比,访谈更具灵活性、即时性和意义解释功能访谈者可以在与受访者交流的时候询问他们的看法,了解他们对自己创造的实物的意义解释,探询这些实物与他们生活中其他事件直接的关系。【1】

(二)访谈的类型

      质的研究中,访谈主要指开放型访谈和半开放型访谈。根据受访者的人数,访谈可以分为个别访谈(一对一)和集体访谈(1-3名访谈者和6-10名参与者)。根据访谈的次数,访谈可分为一次性访谈(收集事实性信息)和多次性访谈(追踪调查、深入探究某些问题)。 虽然访谈的形式多种多样,对访谈形式的选择依据研究的问题、目的、对象、情境和研究阶段不同有所不同,在必要时可以结合不同的方式。焦点小组(团体)访谈是集体访谈中最常见的一种方式。【1】

(三)访谈的注意事项

    1.目的性抽样

     质性研究一般采用“非概论抽样”方式,使用最多的是“目的性抽样”,即按照研究的目的抽取能够为研究问题提供最大信息量的研究对象。目的性抽样按照样本特性可以分为:极端个案或偏差型个案抽样、强度抽样(较高信息密度和强度的个案)、最大差异抽样、同质性抽样典型个案抽样分层目的型抽样、关键个案抽样、效标抽样(criterion sampling,按设定标准选择个案)、证实和伪证个案抽样。【1】

    2. 访谈提纲

    访谈提纲应该是粗线条的,列出访谈者在访谈中应该了解的主要问题和应该覆盖的内容范围。访谈提纲应该尽可能简洁明了,最好只有一页纸,可以一眼就全部看到。访谈提纲应该随时进行修改,前一次(或者是对前一个受访者)访谈的结果可以作为下一次(或是对下一个受访者)的访谈设计提供依据。【1】

      在质的访谈中,访谈者除了应该尽量使用开放型(以什么、如何和为什么为主线)、具体型和清晰型问题以外,还需要有意识地使用追问这一手段,对有关问题进行深入的探讨。【1】

(四)编码

    1. 分段与编码
    分段(segmenting)就是把数据分解成有意义的分析单位。一个有意义的文本单位可能是一个词、一个单独的句子、几个句子,也可能是一个段落或文档。编码(coding)就是把数据段标上符号、描述性词语或类别名称(类别标签)的过程。在编码期间,随着新编码的形成,如果它们尚未列入清单,有必要把它们添加到编码的总清单(master list)上。编码过程有编码者间信度(intercoder reliability),即不同编码者的一致性;也有编码者内部信度(intracoder reliability),即每个单一编码者的一致性。【4】

    2. 归纳编码和先验编码
     归纳编码(inductive codes)指研究者在编码过程中,通过直接检验数据而形成的编码,这种编码以客位术语(参与者自己所使用的术语)为基础。先验编码(priori codes),也称预先编码,指研究者按照一个已经定好的编码方案进行编码,这种编码常用于试图重复或扩展某个先前的研究。研究者可以在数据收集之前,基于与研究问题的相关性,建立一些先验编码。在实践中,许多研究者既会采用预先编码,也会采用归纳编码。 【4】 

    3. 点查

    点查(enumeration)是指词语或编码类别在数据中出现的频率,是一种对质性数据进行量化的过程,它可以传达一些诸如“数量”或“频率”的概念。列出频率也有助于识别数据中突出的主题。然而,一个词语出现的频率较高,或许仅仅是因为一个或两个研究参与者多次使用了这个词,而不是因为有许多不同的参与者使用了这个词。【4】 

    4. 创建分层分类系统
    分类是定性数据分析的基本构建模块,因为研究者通过识别和研究数据中出现的类别来理解这些数据。在对数据进行编码之后,研究者往往关注由分类系统所展现的主题和关系。定性研究中的常见语义关系有包含关系、空间分布、因果关系、基本原理、功能关系、顺序关系、手段-目的、归属关系等等。在分析定性数据的类别关系时,可以通过把两个或多个维度交叉分类来获取一些新的、有趣的信息。定性分析通常使用绘图(diagramming)来展现不同分类之间的关系。【4】

(五)扎根理论

     1. 扎根理论的特点
      研究者在研究开始之前一般没有理论假设,直接从原始资料中归纳出概念和命题,然后上升到理论。这是一种自下而上建立理论的方法,即在系统收集资料的基础上,寻找反映现象的核心概念,然后通过在这些概念之间建立起联系而形成理论。【1】
      研究的目的是生成理论,而理论必须来自经验资料(empirical data);研究是一个针对现象系统地收集和分析资料,从资料中发现、发展和检验理论的过程。扎根理论研究人员喜欢分析胜过描述,喜欢新鲜的概念类别(category)胜过预先设定的观点,喜欢系统聚焦的、连续收集的资料胜过大量同时收集的资料(Charmaz,2006)。【2】

    2. 扎根理论的操作程序
     扎根理论的主要操作程序如下:(1)对资料进行逐级编码,从资料中产生概念;(2)不断地对资料和概念进行比较,系统地询问与概念有关的生成性理论问题;(3)发展理论性概念,建立概念与概念之间的联系;(4)理论性抽样,系统地对资料进行编码;(5)建构理论,力求获得理论概念的密度、变异度和高度的整合性。【1】
    3. 三级编码
      对资料进行逐级编码是扎根理论中最重要的一环,其中包括三个级别的编码:【1】
  • 一级编码——开放式编码(open coding)。编码的目的是从资料中发现本土概念(被研究者的话语,不等同于语词),对码号(code)加以命名。开放式编码开始时编码比较宽,编码越细致越好,随后不断地缩小范围,直到码号达到饱和。
  • 二级编码——轴心式编码(axial coding),又称关联式编码。主要任务是发现和建立概念类属之间的各种关系,这些联系可以是因果关系、类型关系、结构关系、功能关系、过程关系、策略关系等。
  • 三级编码——选择式编码(selective coding),又称核心式编码。在所有发现的概念类属中经过系统分析以后选择一个“核心类属”,将分析集中到那些与该核心类属有关的编码上。核心类属应该具有统领性,能够将大部分研究结果囊括在一个比较宽泛的理论范围之内。
【3】
    4. 不断比较的方法
      扎根理论的主要分析思路是比较,在资料和资料之间、理论和理论之间不断进行对比,然后根据资料与理论之间的相互关系提炼出有关的类属及其属性。这种比较通常有四个步骤:(1)根据概念的类别对资料进行比较;(2)将有关概念类属与它们的属性进行整合,同时对这些概念类属进行比较;(3)勾勒出初步呈现的理论,并将初步的理论返回到原始资料进行验证,优化现有理论,确保理论可以解释大部分原始资料;(4)对理论进行陈述。【1】

    5. 撰写备忘录
      Glaser认为,概念的产生和发展都需要通过备忘录的撰写,一旦有想法就停止编码,撰写备忘录。尽管开放编码可以快速产生许多代码,但需要经常停止编码,通过撰写备忘录来记录想法,因为此时研究人员脑海中关于数据的想法是最新鲜的,撰写备忘录可以让研究人员看清楚下一步需要做什么,进而促进理论性抽样。即便是最后的论文写作,也是对备忘录的系统整理。【2】

(六)定性数据分析软件

      1.  MAXQDA是一种定性、定量和混合方法的数据分析工具。它可以让你输入各种来源的数据,比如调查、访谈和焦点小组等等,从文本到图像、音频/视频文件、网站、推文、焦点小组讨论、调查回复等等。用户可以对这些数据进行标记和分类,以便进行分析。
      2.  NVivo与MAXQDA一样,它允许用户组织和存储定性数据,以便进行分析。您还可以导入word文档、PDF、音频、图像和视频。

   
参考文献
[1]陈向明. 质的研究方法与社会科学研究[M].北京:教育科学出版社,2000:103-116;165-181;182-194;318-338.
[3] Saldana, J. (2013). The coding manual for qualitative researchers. (2nd Ed.) Thousand Oaks: SAGE
[4] 伯克·约翰逊,拉里·克里斯滕森 著,马健生 等译.  教育研究:定量、定性和混合方法(第4版)[M]. 重庆:重庆大学出版社,2015:480-506.
In reply to 红亮 马

回复: 访谈数据分析

by 红亮 马 -

二、访谈数据分析实例


1. 开放编码(open coding)


2. 预设编码(predetermined coding)

In reply to 红亮 马

回复: 访谈数据分析

by 红亮 马 -

三、开放问题数据分析实例


  • Boesdorfer, S.B., Del Carlo, D.I. & Wayson, J.(2022). Secondary Science Teachers’ Definition and Use of Data in Their Teaching PracticeResearch in Science Education, 52, 159–171. (研究了美国451名科学教师有关数据驱动教学的问卷数据,其中包括3道开放型问题的数据。对质性数据,每位研究者分别阅读一个问题的所有回答,然后归纳出初始的编码方案及相应的定义,接着讨论产生该问题的综合编码方案。其中需要明确界定每个编码以及形成研究者之间的共识。单独对每个问题进行编码之后,再比较三个问题的编码目录及其定义,寻找相似之处和其中的模式。最终整合的编码、定义作为基础的主题,用来回答所研究的问题。)
  • Mouza, C., Codding, D. M., & Pollock, L. (2022). Investigating the impact of researchbased professional development on teacher learning and classroom practice: Findings from computer science education. Computers & Education.(对94名计算机教师后测问卷中的2道开放题进行了开放编码,共进行了2轮,给出了Parent Code和Child code的定义以及摘录案例。)
  • Ung, L-L. et al. (2022). Computational thinking for teachers: Development of a localised E-learning system. Computers & Education,177. (设计开发了旨在提高教师CT教学的myCTGWBL数字化学习系统,共369名教师参与了干预的前测和后测,其中测试包括了多项开放问题。研究者应用简单的文本分析技术对这些开放问题进行了分析,包括类别和对应回答者数量,并进行了前后测的对比分析。)