卡方检验

卡方检验

马红亮 -
回帖数:2

一、原理

       不同于二项分布最多只能比较两组比率的差异,卡方检验可以同时处理一个因素的多种类别数据,或多种因素的多种类别数据。如男女人数或比例是否相同,学生优、良、中、差四个成绩的人数比率是否存在差异。卡方检验属于自由分布的非参数检验。【1】

(一)类别数据   

     类别数据是最基本、最普遍的一种数据类型,如性别、职称等人口学或背景变量的调查数据,以及学生对教学方法的态度(赞成、反对或没有意见)的意见调查结果等。通常,以名义尺度(定类数据)或顺序尺度(定序数据)进行测量的数据类型都是类别变量。然而,以等距或比率尺度所测量的数据(学业成绩或身高体重),虽然测量时是连续变量的形式,但如果进行分组处理,如将身高分为高、中、低三组,此时也属于类别变量的统计分析。【2】

(二)类别数据的呈现与检验

    类别数据采集之后,可以以次数分布或列联表(contingency table)的形式来整理、呈现。其中,次数分布表适用于单一类别变量的描述,而列联表适用于两个或多个类别变量的分布形式的描绘。次数也可以转化为百分比。类别变量的检验形式有:【2】
  • 适合度检验(goodness-of-fit test),检验某一变量单一类别变量)是否与某个理论分布或总体分布相符合,如学校性别比例是否为1:1。如果检验统计量未达到显著差异,则该样本在该变量的分布与理论总体无差异。【2】
  • 独立性检验(test of independence),检验两个类别变量之间的关系,例如某一群人的学历分布与性别分布的关系。如果两个类别变量的次数分布没有特殊交互作用,卡方值不显著,则两个变量相互独立;相反的,当两个类别变量次数分布具有特殊相互作用影响时,则说明这两个变量不独立,或具有相关性。【2】

(三)卡方检验

  •  类别变量的次数(或转换成百分比)分布特征,可以进行卡方检验(X2 test)。
  • 一般而言,单元格期望次数小于5时(如人数过少),可能造成统计基本假设的违反,这时需要合并单元、增加样本数或者使用校正公式。【2】
  • Kappa系数,又称同意量数(measures of agreement),适用于具有相等顺序数值的两个顺序变量的关联性分析。Kappa系数所反映的是两个顺序变量是否具有一致的等级,也就是等级一致性程度。Kappa系数可以用来计算两个评分者对同一对象是否有一样的评定的评分者信度(inter-raterreliability)。【2】

参考文献
【1】王孝玲. 教育统计学[M]. 上海:华东师范大学出版社, 2014: 171-186.
【2】邱皓政. 量化研究与统计分析:SPSS(PASW)数据分析范例解析[M]. 重庆大学出版社,2013:124-132.

回复马红亮

回复: 卡方检验-类别数据分析

马红亮 -

   测量的尺度(数据类型)

一、名义尺度(nominal scale)

    名义尺度(也称类别尺度、定类数据)的测量,系针对被观察者的某一现象或特质,评估所属类型种类,并赋予一个特定的数值。如性别、籍贯、种族、婚姻状况、就读学校等。名义变量的数值仅代表不同的类别,没有任何强度、顺序、大小等数学的意义。名义尺度必须符合两个原则:互斥和完整。【1】

二、顺序尺度(ordinal scale)
    顺序尺度(也称定序数据)的测量,除了具有分类意义之外,各名义类别间存在特定的大小顺序关系。顺序变量如大学教授层级、教育程度、社会经济地位等。顺序变量的数值不仅代表不同的类别,且需反映不同类别的前后顺序关系。顺序变量由于没有特定的单位,除了大小顺序之外,数值并无数学逻辑运算的功能与意义。【1】

三、等距尺度(interval scale)
    等距尺度(间距尺度,定距数据),依据特定的单位,测量被观察者某一现象或特质。等距尺度是一种具有标准化单位的测量工具。除了具有分类、顺序意义之外,数值大小反映了两个被观察者的差距和相对距离,且可以进行数学运算,计算各种不同的统计数。如温度计量出的“温度”、考试的“学业成绩”、智力测验的“智商”等。在社会与行为科学研究中,等距尺度是最常用且最重要的一种量尺。等距尺度的另外一个特性,是其单位只是相对的零点,而无绝对零点。【1】

四、比率尺度(ratio scale)
    当一个测量尺度使用了某个标准化的单位,同时又具有绝对零点,称为比率尺度(定比数据)。如身高(公分)、体重(公斤)、工作所得(元)、年龄(岁)、住院日数、受教育年限等变量。比率变量在社会科学中也被广泛应用。比例尺度的数值与数值之间除了具有距离以反映相对位置,同时数值与数值之间的比率具有特定意义。【1】
     对于等距尺度和比率尺度这两个高层次测量变量,研究者重视的是如何将变量数值以特定的公式进一步转换成各种统计数,进行描述或推论,零点意义并非统计方法与数据处理所关心的问题,因此一般研究者不会特别区分等距与比率尺度,而将两者一视同仁,以相同的数据分析与统计方法来处理。【1】

参考文献
【1】邱皓政 著 . 量化研究与统计分析:SPSS(PASW)数据分析范例解析[M]. 重庆大学出版社,2013:22-25.

回复马红亮

回复: 卡方检验

马红亮 -

三、数据实例分析