四格表卡方检验即检验两组样本在某一个类别变量(2分类)上是否有显著差异,比如检验2组在无高血压和有高血压两个类别变量上是否有差异时,用四格表卡方检验;示例:检验2组高血压的患病率是否有差异?
1.录入数据:图1中的group,例如医学中常见的实验组和对照组;图1中的effect,例如医学中的阳性和阴性;有和无;频数,也就是各个格子(Cell)中的例数,这里是实际频数。这几个项目分别成一列(见图1)。
图1.
2.定权重:先在Data中找到Weight case,打开,将ff选作权重(见图2),点·“OK”,完成此步。
图2
3.打开列联表设置:从Analyze(分析)菜单中找到Descriptive Statistics(描述性统计),再找到Crosstabs(列联表),打开(见图3-1)
图3-1
进入该界面后,将group加入行(Row),而effect加入列(Column)(图3-2)。
图3-2
此时,根据分析目的,打开Statistics(统计),选择统计方法,这里我们是要对两个组的率进行比较,所以选择卡方检验Chi-squair和kappa(见图3-3)。点Continue(继续),继续下一步设置。
图3-3
现在,再对Cell(格子)进行设置,点击Cells,选定Observed(实际频数)和Expected(理论频数)(图3-4),如果要计算率,可以继续选R和C。还可以选残差(Residuals).这里举例没有再分析这些内容。
图3-4
4.结果解释:选完上面这些,就可以点击“OK”了,这时结果就出来了(图4),第1个表就是经典的四格表,每个格子上面数字为实际频数,下面数字是理论频数。第二个表格是卡方检验的结果,根据适用条件:四格表,n>=40,理论频数>=5,随机成组两组设计的计数资料,适宜使用Pearson 卡方检验,结果:卡方值(value)23.117,自由度(df);1,双侧概率(Asymp.Sig.)(2-sided);0.000.结论:按照双侧a=0.05的水准,拒绝两组率相等的假设,可以认为两组的患病率有差别。如果选择了设置Percentage,还可以得出两组率的高低。
图4