2024年5月8日发(作者:)

SPSS 17中文版统计分析典型实例精粹

目录

第一篇 SPSS 17基础知识

第1章 SPSS 17入门........................ 3

1.1 SPSS 软件的特点.................. 3

1.2 SPSS的组成与安装............... 4

1.2.1 SPSS for Windows 17.0的模块介绍........ 4

1.2.2 SPSS for Windows 17.0的安装步骤........ 5

1.3 SPSS的运行方式................. 10

1.4 SPSS的主要界面................. 10

1.4.1 SPSS的启动.............. 10

1.4.2 SPSS的数据编辑窗口. 11

1.4.3 SPSS的结果输出窗口 15

1.5 本章小结............................. 18

第2章 数据的基本操作................... 19

2.1 建立数据文件...................... 19

2.1.1 输入数据建立数据文件........................ 19

2.1.2 直接打开其他格式的数据文件............. 20

2.1.3 使用数据库查询建立数据文件............. 21

2.1.4 导入文本文件建立数据文件................. 22

2.2 编辑数据文件...................... 23

2.2.1 输入数据.................... 23

2.2.2 定义数据的属性......... 24

2.2.3 插入或删除数据......... 33

2.2.4 数据的排序................ 34

2.2.5 选择个案.................... 35

2.2.6 转置数据.................... 38

2.2.7 合并数据文件............. 38

2.2.8 数据的分类汇总......... 44

2.2.9 数据菜单的其他功能.. 46

2.3 数据加工............................. 47

2.3.1 数据转换.................... 47

2.3.2 数据的手动分组(编码).................... 50

2.3.3 数据的自动分组(编码).................... 54

2.3.4 产生计数变量............. 55

2.3.5 数据秩(序)的确定.. 57

2.3.6 替换缺失值................ 59

2.4 数据文件的保存或导出........ 61

2.4.1 保存数据文件............. 61

2.4.2 导出数据文件............. 62

2.5 本章小结............................. 62

第3章 SPSS基础统计描述............. 63

3.1 数理统计量概述................... 63

3.1.1 均值(Mean)和均值标准误差(S.E. Mea

n)................................ 63

3.1.2 中位数(Median)...... 64

3.1.3 众数(Mode)............ 64

3.1.4 全距(Range)........... 65

3.1.5 方差(Variance)和标准差(Standard Deviatio

n).......................... 65

3.1.6 峰度(Kurtosis)和偏度(Skewness).. 66

3.1.7 四分位数(Quartiles)、十分位数(Deciles)和

百分位数(Percentiles)...................... 66

3.2 数据描述............................. 67

3.3 频数分析............................. 69

3.4 探索分析............................. 73

3.5 交叉列联表分析................... 78

3.6 比率分析............................. 84

3.7 P-P图和Q-Q图................... 86

3.8 图表绘制............................. 89

3.8.1 条形图....................... 89

3.8.2 线图........................... 94

3.8.3 面积图....................... 96

3.8.4 饼形图....................... 98

3.8.5 高低图....................... 99

3.8.6 箱图......................... 101

3.8.7 直方图..................... 103

3.9 本章小结............................ 104

第4章 SPSS基础模块分析........... 105

4.1 均值分析............................ 105

4.1.1 均值的计算公式....... 105

4.1.2 均值分析菜单........... 106

4.2 方差分析............................ 108

4.2.1 单因素方差分析....... 109

4.2.2 其他方差分析........... 113

4.3 参数检验............................ 116

4.3.1 单样本T检验........... 117

4.3.2 其他参数检验........... 119

4.4 非参数检验........................ 120

4.4.1 卡方检验.................. 121

4.4.2 其他非参数检验....... 124

4.5 回归分析............................ 131

4.5.1 线性回归.................. 131

4.5.2 其他回归分析........... 138

4.6 聚类分析............................ 146

4.6.1 两步聚类分析........... 146

4.6.2 其他聚类分析........... 152

4.7 判别分析............................ 154

4.7.1 判别的函数公式....... 155

4.7.2 判别分析的菜单....... 155

4.8 因子分析与主成分分析....... 161

4.8.1 因子分析.................. 161

4.8.2 主成分分析.............. 166

4.9 时间序列分析..................... 167

4.9.1 定义日期变量........... 168

4.9.2 创建时间序列........... 169

4.9.3 填补缺失数据........... 171

4.9.4 时间序列分析........... 171

4.10 生存分析.......................... 172

4.10.1 寿命表分析............. 173

4.10.2 其他生存分析......... 174

4.11 相关分析.......................... 176

4.11.1 简单相关分析......... 176

4.11.2 散点图.................... 181

4.11.3 偏相关分析............. 184

4.12 信度分析.......................... 186

4.12.1 信度分析概述......... 187

4.12.2 SPSS信度分析....... 189

4.12.3 信度分析的其他问题........................ 192

4.13 本章小结.......................... 197

第二篇 SPSS 17统计分析应用实例

第一部分 调查统计

第5章 调查统计入门实例.............. 203

5.1 硬币均匀性判断................ 203

5.1.1 实例内容说明........... 203

5.1.2 实现方法分析........... 204

5.1.3 具体操作步骤........... 204

5.2 使用回归分析判断住房与收入的关系........... 207

5.2.1 实例内容说明........... 207

5.2.2 实现方法分析........... 208

5.2.3 具体操作步骤........... 208

5.3 不同性别同学成绩的均值和方差分析........... 216

5.3.1 实例内容说明........... 216

5.3.2 实现方法分析........... 216

5.3.3 具体操作步骤........... 216

5.4 本章小结............................ 220

第6章 调查统计提高实例.............. 221

6.1 学生身高的探索性分析....... 221

6.1.1 实例内容说明........... 221

6.1.2 实现方法分析........... 222

6.1.3 具体操作步骤........... 222

6.2 使用对数线性模型分析骨折资料.................. 229

6.2.1 实例内容说明........... 229

6.2.2 实现方法分析........... 229

6.2.3 具体操作步骤........... 230

6.3 培训班学习成绩的显著性分析..................... 237

6.3.1 实例内容说明........... 237

6.3.2 实现方法分析........... 238

6.3.3 具体操作步骤........... 238

6.4 本章小结............................ 241

第7章 调查统计经典实例.............. 243

7.1 学习成绩的聚类分析.......... 243

7.1.1 实例内容说明........... 243

7.1.2 实现方法分析........... 243

7.1.3 具体操作步骤........... 244

7.2 身体生长发育指标的地区显著性差异判断.... 251

7.2.1 实例内容说明........... 251

7.2.2 实现方法分析........... 252

7.2.3 具体操作步骤........... 252

7.3 复习时间和考试成绩的关系判断.................. 262

7.3.1 实例内容说明........... 262

7.3.2 实现方法分析........... 263

7.3.3 具体操作步骤........... 263

7.4 本章小结............................ 266

第二部分 市场研究

第8章 市场研究入门实例.............. 269

8.1 机电产品销售额的影响因素分析.................. 269

8.1.1 实例内容说明........... 269

8.1.2 实现方法分析........... 270

8.1.3 具体操作步骤........... 270

8.2 消费支出与可支配收入的线性回归分析....... 276

8.2.1 实例内容说明........... 276

8.2.2 实现方法分析........... 277

8.2.3 具体操作步骤........... 277

8.3 商品的季节性分析.............. 289

8.3.1 实例内容说明........... 289

8.3.2 实现方法分析........... 290

8.3.3 具体操作步骤........... 290

8.4 本章小结............................ 300

第9章 市场研究提高实例.............. 301

9.1 保险公司革新速度与规模及其类型间的关系分

析................................... 301

9.1.1 实例内容说明........... 301

9.1.2 实现方法分析........... 302

9.1.3 具体操作步骤........... 302

9.2 不同厂家同种产品的质量分析..................... 313

9.2.1 实例内容说明........... 313

9.2.2 实现方法分析........... 314

9.2.3 具体操作步骤........... 314

9.3 合成纤维的强度与拉伸倍数的关系分析....... 318

9.3.1 实例内容说明........... 318

9.3.2 实现方法分析........... 319

9.3.3 具体操作步骤........... 319

9.4 本章小结............................ 325

第10章 市场研究经典实例............ 327

10.1 灯丝不同的灯泡的使用寿命分析................ 327

10.1.1 实例内容说明......... 327

10.1.2 实现方法分析......... 327

10.1.3 具体操作步骤......... 328

10.2 不同商品的消费者满意度分析................... 336

10.2.1 实例内容说明......... 336

10.2.2 实现方法分析......... 337

10.2.3 具体操作步骤......... 337

10.3 顾客对不同款式衬衣喜爱程度的分析......... 344

10.3.1 实例内容说明......... 344

10.3.2 实现方法分析......... 344

10.3.3 具体操作步骤......... 344

10.4 本章小结.......................... 348

第三部分 企业/政府数据分析

第11章 企业/政府数据分析入门实例...................... 351

11.1 儿童身高数据频数分析..... 351

11.1.1 实例内容说明......... 351

11.1.2 实现方法分析......... 352

11.1.3 具体操作步骤......... 352

11.2 百姓对奥运会评价的方差分析.................... 360

11.2.1 实例内容说明......... 360

11.2.2 实现方法分析......... 361

11.2.3 具体操作步骤......... 361

11.3 居民交通工具使用情况的回归分析............. 369

11.3.1 实例内容说明......... 369

11.3.2 实现方法分析......... 370

11.3.3 具体操作步骤......... 370

11.4 本章小结.......................... 377

第12章 企业/政府数据分析提高实例...................... 379

12.1 卫生部门对居民寿命情况的分析............... 379

12.1.1 实例内容说明......... 379

12.1.2 实现方法分析......... 379

12.1.3 具体操作步骤......... 380

12.2 农作物产量与降水量和平均温度的相关性分

析..................................... 386

12.2.1 实例内容说明......... 386

12.2.2 实现方法分析......... 386

12.2.3 具体操作步骤......... 387

12.3 加强体育锻炼与增强身体素质的关系分析.. 390

12.3.1 实例内容说明......... 390

12.3.2 实现方法分析......... 390

12.3.3 具体操作步骤......... 391

12.4 本章小结.......................... 394

第13章 企业/政府数据分析经典实例...................... 395

13.1 当代大学生价值观的因子分析................... 395

13.1.1 实例内容说明......... 395

13.1.2 实现方法分析......... 396

13.1.3 具体操作步骤......... 397

13.2 职业女性家庭特征资料的信度评价............ 404

13.2.1 实例内容说明......... 404

13.2.2 实现方法分析......... 405

13.2.3 具体操作步骤......... 405

13.3 对国内生产总值和零售总额之间的关系分

析........................................ 412

13.3.1 实例内容说明......... 412

13.3.2 实现方法分析......... 413

13.3.3 具体操作步骤......... 414

13.4 本章小结.......................... 420

第四部分 医学统计分析

第14章 医学统计分析入门实例..... 423

14.1 血红蛋白值描述性统计分析....................... 423

14.1.1 实例内容说明......... 423

14.1.2 实现方法分析......... 424

14.1.3 具体操作步骤......... 424

14.2 环氯胍的半数致死剂量计算....................... 428

14.2.1 实例内容说明......... 428

14.2.2 实现方法分析......... 429

14.2.3 具体操作步骤......... 429

14.3 发硒与血硒的相关分析..... 435

14.3.1 实例内容说明......... 435

14.3.2 实现方法分析......... 436

14.3.3 具体操作步骤......... 436

14.4 本章小结.......................... 439

第15章 医学统计分析提高实例..... 441

15.1 用统计图描述血压状态与冠心病的关系..... 441

15.1.1 实例内容说明......... 441

15.1.2 实现方法分析......... 441

15.1.3 具体操作步骤......... 442

15.2 判断红细胞计数的频数是否呈正态分布..... 448

15.2.1 实例内容说明......... 448

15.2.2 实现方法分析......... 448

15.2.3 具体操作步骤......... 449

15.3 胃癌患者发生术后院内感染的影响因素分

析........................................ 452

15.3.1 实例内容说明......... 452

15.3.2 实现方法分析......... 453

15.3.3 具体操作步骤......... 453

15.4 本章小结.......................... 462

第16章 医学统计分析经典实例..... 463

16.1 不同治疗方案的生存率分析....................... 463

16.1.1 实例内容说明......... 463

16.1.2 实现方法分析......... 464

16.1.3 具体操作步骤......... 465

16.2 不同制剂的药效分析........ 473

16.2.1 实例内容说明......... 473

16.2.2 实现方法分析......... 473

16.2.3 具体操作步骤......... 474

16.3 同种药物在不同治疗阶段的药效分析......... 481

16.3.1 实例内容说明......... 481

16.3.2 实现方法分析......... 481

16.3.3 具体操作步骤......... 483

16.4 本章小结.......................... 487

《SPSS 17中文版统计分析典型实例精粹》:以经典统计学软件SPSS 17中文版为

写作平台,提供软件命令的中英对照

基础篇学习软件基本操作和统计描述知识,实例篇详解案例应用原理、流程和

操作技巧

36个实例典型、丰富,涉及调查统计、市场研究、企业/政府数据分析和医学

统计领域

循序渐进、由浅入深,围绕SPSS应用的原理、流程和操作技巧娓娓阐述 插图:

1.3 SPSS的运行方式

SPSS提供了三种基本的运行方式:完全窗口菜单运行方式、程序运行方式和批

处理方式。

完全窗口菜单运行方式简单明了,除人工输入数据需要键盘外,大部分的操作

命令、统计分析方法的实现都是通过菜单、图标按钮和对话框来完成的,使用

者无需掌握编程知识就可以使用SPSS软件,适用于传统的统计分析人员。

程序运行方式和批处理方式则是从使用者特殊的分析需求出发,编写SPSS命令

程序,通过语句直接运行的。这两种运行方式要求使用者掌握专业的SPSS编程

语法,对使用者的要求较高。

1.4 SPSS的主要界面

1.4.1 SPSS的启动

SPSS安装完毕后,系统会自动在Windows的【开始】菜单下创建快捷方式。打

开【开始】菜单,在“SPSS for Windows”下选中“SPSSl7.0 for Windows”

并单击,即可启动SPSS。

当用户运行SPSS软件后,计算机屏幕上会出现一个SPSS启动操作对话框,如

图1.10所示。在该对话框中,用户可以选择打开数据的方式。对话框中包括一

个六选一的单选按钮组和一个复选框,分别说明如下:

“您希望做什么?(What would you like to do?)”单选按钮组

运行教程(Runthetutorial):单击选中后,SPSS将打开帮助教程,在教程中,

用户可选择不同模块的帮助说明进行有针对性的辅导。

输入数据(Type in data):需要手动输入数据,建立新的数据文件时可选择此

项。选中后,即进入空白的SPSS数据编辑窗口。

运行现有查询(Run an existing query):选中后,可以选择查询文件(.spq)

的位置,并可单击打开。

第3章 SPSS基础统计描述

SPSS基础统计描述是进行统计分析的基础和前提。使用一些数学统计量来直观

地描述原始数据的集中程度、离散状况和分布情况,之后就可以对数据的总体

特征进行较为准确的归纳,从而便于选择合适的统计分析方法。基础统计描述

主要包括数据描述、频数分析、探索分析、交叉列联表分析、P-P图、Q-Q图等,

下面将具体介绍。

3.1 数理统计量概述

SPSS在描述性统计分析中,提供了多个统计量来描述数据特征,这些统计量包

括均值、中位数、众数、方差、标准差、四分位数、十分位数、百分位数、峰

度系数、偏度系数等。在进行描述性统计分析之前,首先要对这些统计量在统

计学上的定义及其计算公式有所了解。

3.1.1 均值(Mean)和均值标准误差(S.E. Mean)

均值(平均数、平均值)表示的是某个变量所有取值的集中趋势或平均水平。

例如,某班学生数学考试的平均成绩、公司员工的平均收入、某年级学生的平

均身高、某高校高招录取平均分等。

平均数有总体平均数和样本平均数之分。

总体平均数:若一组数据

X

1

X

2

,……,

X

N

代表一个大小为

N

的有限总体,则其

总体平均数为:

(3.

1)

样本平均数:若一组数据

x

1

x

2

,……,

x

n

代表一个大小为

n

的有限样本,则其

样本平均数为:

(3.2)

样本数据是从总体数据中抽取出来的,但在不同次抽样中得到的样本是不同的。

虽然在一定程度上,样本数据可以反映总体数据的特征,但由于抽样等原因,

样本数据是总体数据的随机变量。同样,虽然样本均值可以反映总体数据的特

征,但在不同次抽样中所得的样本均值是不同的,并且它们与总体均值间存在

差异。

均值标准误差(Standard Error of Mean,S.E. Mean,简称标准误)就是描述

这些样本均值与总体均值之间平均差异程度的统计量。

3.1.2 中位数(Median)

中位数是将总体数据的各个数值按大小顺序排列,居于中间位置的变量,用Me

dian表示。中位数将所有的数据等分成两半,中位数两端的数据个数相同,因

此它也被称为二分位数。中位数的确定,仅仅取决于它在数列中的位置,不受

极端值的影响,因此可以用它表示总体的一般水平。同时,中位数比算术平均

数具有更好的稳定性。

一个大小为

N

的数列,要求其中位数,首先应把该数列按大小顺序排列,如果

N

为奇数,那么该数列的中位数就是

是该数列中第与第

位置上的数;如果

N

为偶数,中位数则

位置上的两个数值的平均数。

3.1.3 众数(Mode)

众数是指总体数据中出现次数最多的变量,用Mode表示。它同样不受数据极端

值的影响,从而在一定程度上提高了平均水平的代表性。例如,制衣厂可以根

据消费者所需服装尺码的众数来安排生产。此外,如果众数的值出现的频数或

频率较大,那么说明众数的代表性就越高,数列的集中趋势也就越显著。

确定众数没有明确的公式,一般只能用手工统计,故较为烦琐。SPSS所提供的

统计功能可以减少诸如此类烦琐的过程。

众数、中位数与算术平均数之间存在一定的关系,这种关系决定于总体分布的

状况。当总体分布呈对称的钟形分布时,算术平均数位于分布曲线的对称点上,

而该点又是曲线的最高点和中心点,因此,众数、中位数和算术平均数三者相

等。当总体分布呈非对称的钟形分布时,由于这三种平均数受极端数值影响程

度的不同,因而它们的数值就存在一定的差别,但三者之间仍有一定的关系。

当分布右偏时,算术平均数受偏高数值影响较大,其位置必然在众数之右,中

位数在众数与算术平均数之间。反之,当次数分布左偏时,算术平均数受偏小

数值的影响较大,其位置在众数之左,中位数仍在众数与算术平均数之间。

以上的均值、中位数和众数都是反映数据集中趋势的统计量。

3.1.4 全距(Range)

全距,又称极差,是数据的最大值(Maximum)与最小值(Minimum)之间的绝

对差,借以表明总体标志值最大可能的差异范围。全距越长,说明数据越离散;

反之,全距越小,说明数据越集中。

用符号表示全距的计算公式为:

(3.3)

全距的缺点在于其方法过于粗略,因为它只考虑总体两端数值的差异,没有考

虑中间数值差异的情况,因而它是测定离散程度的一种粗略的方法,不能全面

反映总体数据的差异程度。要充分利用每一个数据的信息,就需要利用方差和

标准差。

3.1.5 方差(Variance)和标准差(Standard Deviation)

方差是总体所有变量值与其算术平均数偏差平方的平均值,它表示了一组数据

分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平

均数的平均离散程度。总体方差公式:

(3.4)

总体标准差公式:

(3.5)

样本方差公式:

(3.6)

样本标准差:

(3.

7)

其中,

m

为总体平均数,为样本平均数,

N

为总体的个数,

n

为样本的个数。

虽然标准差有计量单位,而方差无计量单位,但两者的作用一样,故在此仅介

绍标准差。标准差用平方的方法消除了正负号,因而它是最常用、最重要的离

散趋势统计量。标准差越大,表示变量值之间的差异越大,各数据距离均值越

远,则平均数的代表性就越低。反之,标准差越小,表示变量值之间的差异越

小,各数据距离均值较近,则平均数的代表性就越高。

标准差在实际生活中也有广泛的应用。例如,可以用标准差来测定居民收入分

配的差异程度,还可以用来反映平均收支、平均结余、平均产量等经济变量的

代表性等。

全距、方差和标准差都是反映数据离散趋势的统计量。

3.1.6 峰度(Kurtosis)和偏度(Skewness)

峰度是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正

态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰

度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0

表示该总体数据分布与正态分布相比较为平坦,为平顶峰。峰度的绝对值数值

越大表示其分布形态的陡缓程度与正态分布的差异程度越大。

峰度的具体计算公式为:

(3.8)

偏度与峰度类似,它也是描述数据分布形态的统计量,其描述的是某总体取值

分布的对称性。这个统计量同样需要与正态分布相比较,偏度为0表示其数据

分布形态与正态分布的偏斜程度相同;偏度大于0表示其数据分布形态与正态

分布相比为正偏或右偏,即有一条长尾巴拖在右边,数据右端有较多的极端值;

偏度小于0表示其数据分布形态与正态分布相比为负偏或左偏,即有一条长尾

拖在左边,数据左端有较多的极端值。偏度的绝对值数值越大表示其分布形态

的偏斜程度越大。

偏度的具体计算公式为:

(3.9)

3.1.7 四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percent

iles)

四分位数是将一组数据由小到大(或由大到小)排序后,用3个点将全部数据

分为4等份,与这3个点位置上相对应的数值称为四分位数,分别记为

Q

1

(第

一四分位数)、

Q

2

(第二四分位数,即中位数)、

Q

3

(第三四分位数)。其中,

Q

3

Q

1

之间的距离的一半又称为四分位差,记为

Q

。四分位差越小,说明中间部

分的数据越集中;四分位数越大,则意味着中间部分的数据越分散。

与四分位数类似,十分位数是将一组数据由小到大(或由大到小)排序后,用9

个点将全部数据分为10等份,与这9个点位置上相对应的数值称为十分位数,

分别记为

D

1

D

2

,……,

D

9

,表示10%的数据落在

D

1

下,20%的数据落在

D

2

下,……,

90%的数据落在

D

9

下。

同理,百分位数是将一组数据由小到大(或由大到小)排序后分割为100等份,

与99个分割点位置上相对应的数值称为百分位数,分别记为

P

1

P

2

,……,

P

99

表示1%的数据落在

P

1

下,2%的数据落在

P

2

下,……,99%的数据落在

P

99

下。

通过四分位数、十分位数和百分位数,可以大体看出总体数据在哪个区间内更

为集中,也就是说,它们在一定程度上可以反映数据的分布情况。

上面的峰度系数、偏度系数和四分位数、十分位数、百分位数,都是反映数据

分布状况的统计量。

3.2 数据描述

描述性统计分析是对数据进行基础性的描述。通过得出的数据的平均值(Mean)、

和(Sum)、标准差(Std deviation)、最大值(Max)、最小值(Min)、方

差(Variance)、全距(Range)、均值标准误差(S.E. Mean)、峰度(Kurto

sis)、偏度(Skewness)等统计量,来估计原始数据的集中程度、离散状况和

分布情况。

数据描述功能的操作步骤如下:

01

打开【分析】(Analyze)菜单,选择【描述统计】(Descriptive Statist

ics)命令下的【描述】(Descriptives)命令,如图3-1所示。

这里,需要提醒的是如果数据文件尚未打开,【分析】(Analyze)菜单下的任

一功能都不能使用,SPSS会弹出一个对话框,如图3-2所示,提醒用户打开文

件。打开文件后,【分析】(Analyze)菜单下的统计功能才能正常使用。

图3-1 【分析】(Analyze)菜

单 图3-2 未打开文件提醒对话框

02

选择【描述】(Descriptives)命令后,SPSS将打开“描述性”(Descript

ives)对话框,如图3-3所示。

图3-3 “描述性”主对话框

在该主对话框中,用户可以通过单击按钮从左边原变量中选择一个或者几个

变量进入右边的“变量”(Variable(s))列表框中。

对话框底部有一个“将标准化得分另存为变量”(Save standardized values

as variables)复选框,选择该项,将对“变量”(Variable(s))列表框中被

选中变量的数据进行标准化,然后将标准化的结果保存到新变量中。新变量的

变量名为原变量的变量名前面添加字母“z”,并被添加在数据编辑窗口中变量

的最后一列。

数据标准化的计算公式为:

(3.

10)

通过标准化,可以将均值为

m

、标准差为

s

的原变量转化成均值为0、标准差为1的

新变量。

“描述性”(Descriptives)主对话框的

下端有5个按钮,如果还未将左边原变量

中的变量添加至“变量”(Variable(s))

列表框中,则【确定】(OK)和【粘贴】

(Paste)按钮为灰白显示,不可单击,但【重置】(Reset)、【取消】(Can

cel)和【帮助】(Help)按钮可以单击。通过单击【重置】(Reset)按钮,

用户可以将已进入右框的变量全部转移至左框的变量列表中,重新进行选择。

03

单击【选项】(Options)按钮,将打开“描述:选项”(Descriptives:O

ptions)对话框,如图3-4所示。

在该对话框中,用户可以选择所要统计的统计量和图表输出方式。具体对话框

中各选项的意义如下:

(1)在对话框中最上面一行是均值(Mean)和合计(Sum)。

(2)离散(Dispersion)栏中的统计量包括:

标准差(Std Deviation) 最小值(Minimum)

方差(Variance) 最大值(Maxim

um)

范围(极差)(Range) 均值的标准误(S.E. Mea

n)

(3)分布(Distribution)栏中的统计量包括:

峰度(Kurtosis) 偏度(Skewnes

s)

(4)显示顺序(Display Order)栏中,用户可以自行选择输出变量的排序方

式,包括:

l 变量列表(Variable List):在结果输出窗口中,用户选择输出的

变量将按照变量在数据编辑窗口中原来的排列顺序进行排列。

l 字母顺序(Alphabetic):在结果输出窗口中,用户选择输出的变

量将按照变量名的字母排列顺序进行排列。

l 按均值的升序排序(Ascending Means):SPSS将计算每个输出变量

的平均值,并按照平均值从小到大对输出变量的顺序进行排列。

l 按均值的降序排序(Descending Means):SPSS将计算每个输出变

量的平均值,并按照平均值从大到小对输出变量的顺序进行排列。

用户可在“选项”(Options)对话框第一行、离散(Dispersion)栏和分布(D

istribution)栏中,选中所需统计的统计量(可多项选择)。SPSS默认的描述

统计量包括均值、标准差、最小值、最大值。在“显示顺序”(Display Order)

一栏里,用户只可选择一种变量排序方式,SPSS的默认选项为“变量列表”(V

ariable List)。

进行选择后,单击【继续】(Continue)按钮,即可返回“描述性”(Descrip

tives)主对话框。

04

单击【确定】(OK)按钮,即可在结果输出窗口中得到描述性统计分析结果

输出表格。

3.3 频数分析

对于一组数据,考察不同的数值出现的频数,或者是数据落入指定区域内的频

数,可以了解数据的分布状况。从SPSS15.0开始就提供了“频数分析”这一功

能。通过频数分析,用户在得到描述性统计结果的同时,还能了解变量取值的

分布情况,从而使总体数据的分布通过频数分析得到更为清晰、准确的输出。

频数分析的具体操作步骤如下:

01

打开数据文件,选择【分析】(Analyze)菜单,单击【描述统计】(Descr

iptive Statistics)命令下的【频率】(Frequencies)命令。SPSS将弹出“频

率”(Frequencies)主对话框,如图3-5所示。

图3-5 “频率”(Frequencies)主对话框

在该主对话框中,同样可以通过单击按钮从左边的原变量中选择一个或者几

个变量进入右边的“变量”(Variable(s))列表框中。

对话框底部有一项“显示频率表格”(Display frequency tables)复选框,S

PSS默认选择此项。选择此项后,输出结果将显示频数分布表,否则只显示直方

图,不显示频数分布表。

“频率”主对话框的右方有3个按钮,从上到下依次为【统计量】(Statistic

s)按钮、【图表】(Charts)按钮和【格式】(Format)按钮。单击可进入对

应对话框。

02

单击【统计量】按钮,打开“频率:统计量”(Frequencies:Statistics)

对话框,如图3-6所示。

图3-6 “频率:统计量”对话框

在该对话框中,用户可以选择所要统计的统计量。对话框中各选项的具体意义

如下:

(1)百分位值(Percentile Values)栏为复选项,在此栏中可选择多项。

l 四分位数(Quartile)

l 割点(Cut points):选择此项,在后面的文本框中输入数值,假

设为

N

N

为在2~100之间的整数),则计算并显示

N

分位数。

l 百分位数(Percentile(s)):选择此项,在后面的文本框中输入数

值,可以有选择地显示百分位数。在文本框中可以输入0到100之间

的数,输入后,单击【添加】(Add)按钮,将对应的百分位数添加

到方框内的列表框中,利用【更改】(Change)按钮和【删除】(R

emove)按钮,可以对列表框中的选项进行修改和删除。

(2)离散(Dispersion)栏(复选项):

标准差(Std Deviation) 最小值(Minimum)

方差(Variance) 最大值(Maxim

um)

范围(极差)(Range) 均值的标准误(S.E. Mea

n)

(3)集中趋势(Central Tendency)栏(复选项):

均值(Mean)、中位数(Median)、众数(Mode)、合计(Sum)。

“集中趋势”栏下方有一个“值为组的中点”(Values are group m

idpoints)复选框,如果假设数据已经分组,而且数据取值为初始分

组的中点,选择此项,将计算百分位数统计和数据的中位数。

(4)分布栏(Distribution)(复选项):

峰度(Kurtosis)、偏度(Skewness)。

用户在“频率:统计量”对话框中单击选中所要统计的统计量后,单击【继续】

(Continue)按钮,即可返回主对话框。

03

单击【图表】(Charts)按钮,打开“频率:图表”(Frequencies:Chart

s)对话框,如图3-7所示。

在该对话框中,用户可以选择频数分析的图表类型。该对话框中各选项的具体

意义如下:

(1)图表类型(Chart Type)(单选项):无(None)(系统默认选项)、条

形图(Bar charts)、饼形图(Pie charts)、直方图(Histograms)。

图3-7 “频率:图表”对话框

(2)图表值(Chart Values)(单选项组):可选择图形中分类值的表现形式。

l 频率(Frequencies):如果图表类型是直方图,则直方图的纵轴为

频数;如果图表类型是饼形图,则饼形图中每块表示属于该组观测值

的频数。

l 百分比(Percentage):如果图表类型是直方图,则直方图的纵轴

为百分比;如果图表类型是饼形图,则饼形图中每块表示该组的观测

量数占总数的百分比。

l 用户在“频率:图表”对话框中选择图表类型和图表分类值后,单

击【继续】(Continue)按钮,即可返回主对话框。

04

单击【格式】(Format)按钮,打开“频率:格式”(Frequencies:Forma

t)对话框,如图3-8所示。

图3-8 “频率:格式”对话框

在该对话框中,用户可以设置频率分布表的输出格式。对话框中各选项的意义

如下:

(1)排序方式(Order by)栏:单选项组,用户可以选择频数分布表中数值及

其对应频率的排列顺序。

l 按值的升序排序(Ascending values):系统默认选项,频数分布

表中将按照数值从小到大排列。

l 按值的降序排序(Descending values):频数分布表中将按照数值

从大到小排列。

l 按计数的升序排序(Ascending counts):频数分布表中将按照计

数从小到大排列。

l 按计数的降序排序(Descending counts):频数分布表中将按照计

数从大到小排列。

如果用户在“频率:图表”对话框中选择输出直方图,频数分布表将

按照数值顺序排列。

(2)多个变量(Multiple Variables)栏:单选项组,当“频率(Frequencie

s)”主对话框的“变量”(Variable(s))列表框中有多个变量时,利用“多

个变量”栏可以设置表格的显示方式。

l 比较变量(Compare variables):系统默认选项,SPSS将所有变量

的描述统计的结果显示在同一张表格中,方便用户进行比较分析。

按变量组织输出(Organize output by variable):SPSS将对应每

个变量分别输出单独的描述统计表格。

用户在“频率:格式”对话框中进行选择后,单击【继续】(Continue)按钮,

即可返回“频率”主对话框。一般情况下,对“频率:格式”对话框的选项都

默认为系统默认值,不作调整。

05

单击【确定】(OK)按钮,即可在结果输出窗口中得到频数分布表、描述性

统计分析输出表格和用户选择的对应的输出图形。

3.4 探索分析

探索分析是在对数据的基本特征统计量有初步了解的基础上,对数据进行的更

为深入详细的描述性观察分析。它在一般描述性统计指标的基础上,增加了有

关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对

数据进行进一步分析的方案。主要的分析如下:

(1)观察数据的分布特征:通过绘制箱锁图和茎叶图等图形,直观地反映数据

的分布形式和数据的一些规律,包括考察数据中是否存在异常值等。过大或过

小的数据均有可能是奇异值、影响点或错误数据。寻找异常值,并分析原因,

然后决定是否从分析中删除这些数据。因为奇异值和影响点往往对分析的影响

较大,不能真实地反映数据的总体特征。

(2)正态分布检验:检验数据是否服从正态分布。很多检验能够进行的前提即

总体数据分布服从正态分布。因此,检验数据是否符合正态分布,就决定了它

们是否能用只对正态分布数据适用的分析方法。

(3)方差齐性检验:用Levene检验比较各组数据的方差是否相等,以判定数

据的离散程度是否存在差异。例如在进行独立右边的T检验之前,就需要事先

确定两组数据的方差是否相同。如果通过分析发现各组数据的方差不同,还需

要对数据进行方差分析,那么就需要对数据进行转换使得方差尽可能相同。Lev

ene检验进行方差齐性检验时,不强求数据必须服从正态分布,它先计算出各个

观测值减去组内均值的差,然后再通过这些差值的绝对值进行单因素方差分析。

如果得到的显著性水平(Significance)小于0.05,那么就可以拒绝方差相同

的假设。

探索分析的具体操作步骤如下:

01打开数据文件,选择【分析】(Analyze)菜单,单击【描述统计】(Descr

iptive Statistics)命令下的【探索】(Explore)命令,SPSS将弹出“探索”

(Explore)对话框,如图3-9所示。

在“探索”(Explore)对话框中,左边的变量列表为原变量列表,通过单击

按钮可选择一个或者几个变量进入右边的“因变量列表”(Dependent List)

框、“因子列表”(Factor List)框和“标注个案”(Label Cases by)列表

框。因变量是用户所研究的目标变量。因子变量是影响因变量的因素,例如分

组变量。标注个案是区分每个观测量的变量,如雇员的ID等。例如,研究同一

班级男生和女生的身高差距时,就可将“身高”变量列入“因变量列表”(Dep

endent List)框中,将“性别”列入“因子列表”(Factor List)框中,同

时将学生的“学号”变量列入“标注个案”(Label Cases by)列表框中。

图3-9 “探索”主对话框

提示:

如果有多个分组变量进入“因子列表”列表框中,那么会以分组变量

的各种取值进行组合分组。如两个分组变量各有2种取值,那么输出

的结果就会有4种组合分组。

在对话框下端的“输出”(Display)框中有三个选项:

l 两者都(Both):默认选项,表示同时输出描述统计量的统计表格

和图形。选择此项将激活右边的【统计量】(Statistics)和【绘制】

(Plots)按钮。

l 统计量(Statistics):表示只输出统计表格,不输出图表。选择

此项将激活右边的【统计量】(Statistics)按钮,【绘制】(Plo

ts)按钮不被激活。

l 图(Plots):表示只输出图表,不输出统计表格。选择此项将激活

右边的【绘制】(Plots)按钮,【统计量】(Statistics)按钮不

被激活。

02

单击【统计量】(Statistics)按钮,打开“探索:统计量(Explore:Sta

tistics)”对话框,如图3-10所示。

图3-10 “探索:统计量”对话框

在该对话框中,4个选择项分别如下:

l 描述性(Descriptives):选择此项,将生成描述性统计表格。表

中显示样本数据的描述统计量,包括平均值、中位数、5%调整平均数、

标准误、方差、标准差、最大值、最小值、组距、四分位数、峰度、

偏度及峰度和偏度的标准误。此项为默认选项,在下面的“均值的置

信区间”(Confidence Interval for Mean)文本框中,用户还可输

入数值指定均值的置信区间的置信度,系统默认的置信度为95%。

l M-估计量(M-estimators):选择此项,将计算并生成稳健估计量。

M估计在计算时对所有观测量赋予权重,随观测量距分布中心的远近

而变化,通过给远离中心值的数据赋予较小的权重来减小异常值的影

响。

l 界外值(Outliers):选择此项,将输出分析数据中的5个最大值

和5个最小值作为异常嫌疑值。

l 百分位数(Percentiles):选择此项,将计算并显示指定的百分位

数,包括5%、10%、25%、50%、75%、90%和95%等。

“探索:统计量”对话框中的4个选项为复选框,用户可进行多项选择,单击

【继续】(Continue)按钮,即可返回“探索”主对话框。

03

单击【绘制】(Plots)按钮,打开“探索:图”(Explore:Plots)对话框,

如图3-11所示。

图3-11 “探索:图”对话框

“探索:图”对话框中有如下4个选择组:

(1)箱图(Boxplots)栏(单选项组):箱图,又称箱锁图。如果用户在“探

索”主对话框的“因变量列表”(Dependent List)框中输入了多个变量名,

则在此选择组中进行选择,可确定箱锁图的生成方式。箱锁图中,底部的水平

线段是数据的最小值(异常点除外),顶部的水平线段是数据的最大值(异常

点除外),中间矩形箱子的底所在的位置是数据的第一个四分位数(即25%分位

数),箱子顶部所在位置是数据的第三个四分位数据(即75%分位数)。箱子中

间的水平线段刻画的是数据的中位数(即50%分位数)。

l 按因子水平分组(Factor levels together,系统默认):选择此

项,将为每个因变量创建一个箱锁图,在每个箱锁图内根据分组变量

的不同水平的取值创建箱形单元。

l 不分组(Dependents together):选择此项,将为每个分组变量的

水平创建一个箱锁图,在每个箱锁图内用不同的颜色区分不同因变量

所对应的箱形单元,方便用户进行比较。

l 无(None):选择此项,不创建箱图。

(2)描述性(Descriptive)栏(复选项):选择该组内的选项,可以生成茎

叶图和(或)直方图。在箱图(Boxplots)组内选择的选项不同,则生成的茎

叶图和直方图也不相同。选择“按因子水平分组”单选按钮时,在创建茎叶图

和(或)直方图时,首先会根据因变量的不同进行分类,为每一个因变量对应

的不同分组变量的不同水平创建一个茎叶图和(或)直方图;选择“不分组”

单选按钮时,在创建茎叶图和(或)直方图时,则首先根据不同分组变量水平

的不同,为每一个因变量创建一个茎叶图和(或)直方图。

l 茎叶图(Stem-and-leaf,系统默认):茎叶图主要由3个部分组成,

即频率(Frequency)、茎(Stem)和叶(Leaf),在图中按从左到

右的顺序依次排列,在图的底端,注明了茎的宽度(Stem Width)和

每一叶所代表的观测量数(Each Leaf)。茎叶图中,茎表示数据的

整数部分,叶表示数据的小数部分(小数位数只有一位,频数的数值

有多大,则对应的小数就有多少个),将茎和叶的数值组合起来再乘

以茎宽,便是该数据的值。由于茎叶图不仅仅能表示数据的频数分布,

还能近似地表示数据的大小,因此它比直方图表达的信息更全面。

l 直方图(Histogram):直接绘制直方图的步骤详见第10章。

(3)带检验的正态图(Normality plots with test,复选框):选择此项,

将进行正态性检验,并生成正态Q-Q概率图和无趋势正态Q-Q概率图。

(4)伸展与级别Levene检验(Spread vs level with Levene Test)栏(单

选项组):对所有的展布-水平图进行方差齐性检验和数据转换,同时输出回归

直线的斜率及方差齐性的Levene检验,但如果没有指定分组变量,则此选项无

效。

l 无(None):不进行Levene检验,系统默认。选择此项,SPSS将不

产生回归直线的斜率和方差齐性检验。

l 幂估计(Power Estimation):对每组数据产生一个中位数的自然

对数及四个分位数的自然对数的散点图。

l 已转换(Transformed):变换原始数据,用户可在后面的参数框中

选择数据变换类型。

l 未转换(Untransformed):不变换原始数据时选择此项。

用户在“探索:图”对话框中进行选择后,单击【继续】(Continue)按钮,

即可返回“探索”主对话框。

04

单击【选项】(Options)按钮,打开“探索:选项”(Explore:Options)

对话框,如图3-12所示。

图3-12 “探索:选项”对话框

在该对话框中,可选择缺失值的处理方式,SPSS提供了3种处理方式:

l 按列表排除个案(Exclude cases listwise,系统默认):选择此

项,对所有的分析过程剔除分组变量和因变量中所有带有缺失值的观

测量数据;

l 按对排除个案(Exclude cases pairwise):同时剔除带缺失值的

观测量及与缺失值有成对关系的观测量。在当前分析过程中用到的变

量数据中剔除带有缺失值的观测量数据,在其他分析过程中可能包含

缺失值;

l 报告值(Report values):选择此项,将分组变量的缺失值单独分

为一组,在输出频数表的同时输出缺失值。

用户在“探索:选项”对话框中进行选择后,单击【继续】(Continue)按钮,

即可返回“探索”主对话框。

05

单击【确定】(OK)按钮,即可在结果输出窗口中得到探索分析过程的数据

概述、基本统计描述表、极端值列表、正态分布检验、方差齐性检验、茎叶图、

直方图、箱锁图、正态分布Q-Q图、离散正态分布Q-Q图等图表。

3.5 交叉列联表分析

在实际分析中,除了需要对单个变量的数据分布情况进行分析外,还需要掌握

多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的

相互影响和关系,这种分析就称为交叉列联表分析。

当所观察的现象同时与两个因素有关时,如某种服装的销量受价格和居民收入

的影响,某种产品的生产成本受原材料价格和产量的影响等,通过交叉列联表

分析,可以较好地反映出这两个因素之间有无关联性及两个因素与所观察现象

之间的相关关系。

因此,数据交叉列联表分析主要包括两个基本任务:一是根据收集的样本数据,

产生二维或多维交叉列联表;二是在交叉列联表的基础上,对两个变量间是否

存在相关性进行检验。要获得变量之间的相关性,仅仅靠描述性统计的数据是

不够的,还需要借助一些表示变量间相关程度的统计量和一些非参数检验的方

法。

常用的衡量变量间相关程度的统计量是简单相关系数,但在交叉列联表分析中,

由于行列变量往往不是连续变量,不符合计算简单相关系数的前提条件。因此,

需要根据变量的性质选择其他的相关系数,如Kendall等级相关系数、Eta值等。

SPSS提供了多种适用于不同类型数据的相关系数表达,这些相关性检验的零假

设都是:行和列变量之间相互独立,不存在显著的相关关系。根据SPSS检验后

得出的相伴概率(Concomitant Significance)判断是否存在相关关系。如果

相伴概率小于显著性水平0.05,那么拒绝零假设,行列变量之间彼此相关;如

果相伴概率大于显著性水平0.05,那么接受原假设,行列变量之间彼此独立。

在交叉列联表分析中,SPSS所提供的相关关系的检验方法主要有以下3种:

(1)卡方(

χ

2

)统计检验:常用于检验行列变量之间是否相关。计算公式为:

(3.1

1)

其中,

f

0

表示实际观察频数,

f

e

表示期望频数。

卡方统计量服从(行数-1)´(列数-1)个自由度的卡方统计。SPSS在计算卡

方统计量时,同时给出相应的相伴概率,由此判断行列变量之间是否相关。

(2)列联系数(Contingency coefficient):常用于名义变量之间的相关系

数计算。计算公式由卡方统计量修改而得,公式如下:

(3.1

2)

(3)

y

系数(Phi and Cramer’s V):常用于名义变量之间的相关系数计算。

计算公式由卡方统计量修改而得,公式如下:

(3.1

3)

y

系数介于0和1之间,其中,

K

为行数和列数较小的实际数。

交叉列联表分析的具体操作步骤如下:

01

打开数据文件,选择【分析】(Analyze)菜单,单击【描述统计】(Descr

iptive Statistics)命令下的【交叉表】(Crosstabs)命令。“交叉表”(C

rosstabs)主对话框如图3-13所示。

图3-13 “交叉表”主对话框

在该主对话框中,左边的变量列表为原变量列表,通过单击按钮可选择一个

或者几个变量进入右边的“行”(Row(s))变量列表框、“列”(Column(s))

变量列表框和“层”(Layer)变量列表框中。

如果是二维列联表分析,只需选择行列变量即可,但如进行三维以上的列联表

分析,可以将其他变量作为控制变量选到“层”(Layer)变量列表框中。有多

个层控制变量时,可以根据实际的分析要求确定它们的层次,既可以是同层次

的也可以是逐层叠加的。

在“交叉表”对话框底端有两个可选择项:

l 显示复式条形图(Display clustered bar chart):指定绘制各个

变量不同交叉取值下关于频数分布的柱形图;

l 取消表格(Suppress table):不输出列联表的具体表格,而直接

显示交叉列联表分析过程中的统计量,如果没有选中统计量,则不产

生任何结果。所以,一般情况下,只有在分析行列变量间关系时选择

此项。

该对话框的右端有4个按钮,从上到下依次为【精确】(Exact)按钮、【统计

量】(Statistics)按钮、【单元格】(Cells)按钮和【格式】(Format)按

钮。单击可进入对应的对话框。

02

单击【精确】(Exact)按钮,打开“精确检验”(Exact Tests)对话框,

如图3-14所示。

该对话框提供了3种用于不同条件的检验方式来检验行列变量的相关性。用户

可选择以下3种检验方式之一:

l 仅渐近法(Asymptotic only):适用于具有渐近分布的大样本数据,

SPSS默认选择该项。

l Monte Carlo(蒙特卡罗法):此项为精确显著性水平值的无偏估计,

无需数据具有渐近分布的假设,是一种非常有效的计算确切显著性水

平的方法。在“置信水平”(Confidence Level)参数框内输入数据,

可以确定置信区间的大小,一般为90、95、99。在“样本数”(Num

ber of samples)参数框中可以输入数据的样本容量。

l 精确(Exact):观察结果概率,同时在下面的“每个检验的时间限

制为”(Time limit per test)的参数框内,选择进行精确检验的

最大时间限度。

用户在本对话框内进行选择后,单击【继续】(Continue)按钮即可返回“交

叉表”主对话框。一般情况下,“精确检验”(Exact Tests)对话框的选项都

默认为系统默认值,不作调整。

图3-14 “精确检验”对话框

03

单击【统计量】(Statistics)按钮,打开“交叉表:统计量”(Crosstab

s:Statistics)对话框,如图3-15所示。

在该对话框中,用户可以选择输出合适的统计检验统计量。对话框中各选项的

意义如下:

(1)卡方(Chi-square)检验复选框:检验列联表行列变量的独立性检验,也

被称为Pearson chi-square检验、

χ

检验。

(2)相关性(Correlations)检验复选框:输出列联表行列变量的Pearson相

关系数或Spearman相关系数。

(3)名义(Nominal)栏:适用于名称变量统计量。

l 相依系数(Contingency coefficient):即Pearson相关系数或S

pearman相关系数。

2

l Phi 和Cramer变量(

y

系数):常用于名义变量之间的相关系数计

算。计算公式由卡方统计量修改而得,如公式(3.13)所示。

ψ

数介于0和1之间,其中,

K

为行数和列数较小的实际数。

l Lambda(

λ

系数):在自变量预测中用于反映比例缩减误差,其值

为1时表明自变量预测因变量好,为0时表明自变量预测因变量差。

l 不定性系数(Uncertainty coefficient):以熵为标准的比例缩减

误差,其值接近1时表明后一变量的信息很大程度上来自前一变量,

其值接近0时表明后一变量的信息与前一变量无关。

图3-15 “交叉表:统计量”对话框

(4)有序(Ordinal)栏:适用于有序变量的统计量。

l Gamma(伽马系数,

γ

系数):两有序变量之间的关联性的对称检验。

其数值界于0和1之间,所有观察实际数集中于左上角和右下角时,

取值为1,表示两个变量之间有很强的相关;取值为0时,表示两个

变量之间相互独立。

l Somers’d值:两有序变量之间的关联性的检验,取值范围为[-1,1]。

l Kendall¢s tau-b值:考虑有结的秩或等级变量关联性的非参数检

验,相同的观察值选入计算过程中,取值范围为[-1,1]。

l Kendall¢s tau-c值:忽略有结的秩或等级变量关联性的非参数检

验,相同的观察值不选入计算过程,取值范围界为[-1,1]。

(5)按区间标定(Nominal by interval)栏:适用于一个名义变量与一个等

距变量的相关性检验。

l Kappa系数:检验数据内部的一致性,仅适用于具有相同分类值和相

同分类数量的变量交叉表。

l Eta值:其平方值可认为是因变量受不同因素影响所致方差的比例。

l 风险(相对危险度):检验事件发生和某因素之间的关联性。

l McNemar检验:主要用于检验配对的资料率(相当于配对卡方检验)。

(6)Cochran's and Mantel-Haenszel统计量复选框:适用于在一个二值因素

变量和一个二值响应变量之间的独立性检验。

用户在“交叉表:统计量”对话框中进行选择后,单击【继续】(Continue),

即可返回“交叉表”(Crosstabs)主对话框。一般情况下,对“交叉表:统计

量”对话框内的选项不作选择或选择较为常用的卡方检验。

04

单击【单元格】(Cells)按钮,打开“交叉表:单元显示”(Crosstabs:C

ell Display)对话框,如图3-16所示。

图3-16 “交叉表:单元显示”对话框

在该对话框中,用户可以指定列联表单元格中的输出内容。SPSS17.0默认在交

叉列联表中输出实际的观察值,但观察值有时候不能确切地反映事物的实质,

因此还需要输出其他的数据项。对话框中各选项的具体意义如下:

(1)计数(Counts)栏:

l 观察值(Observed):系统默认选项,表示输出为实际观察值。

l 期望值(Expected):表示输出为理论值。

(2)百分比(Percentages)栏:

l 行(Row)百分比:以行为单元,统计行变量的百分比。

l 列(Column)百分比:以列为单元,统计列变量的百分比。

l 总计(Total)百分比:行列变量的百分比都进行输出。

(3)残差(Residuals)栏:

l 未标准化(Unstandardized):输出非标准化残差,为实际数与理

论数的差值。

l 标准化(Standardized):输出标准化残差,为实际数与理论数的

差值除以理论数。

l 调节的标准化(Adjusted standardized):输出修正标准化残差,

为标准误确定的单元格残差。

(4)非整数权重(Noninteger Weights)栏:

l 四舍五入单元格计数(Round cell counts,系统默认):将单元格

计数的非整数部分的尾数四舍五入为整数。

l 截短单元格计数(Truncate cell counts):将单元格计数的非整

数部分的尾数舍去,直接化为整数。

l 四舍五入个案权重(Round case Weights):将观测量权数的非整

数部分的尾数四舍五入为整数。

l 截短个案权重(Truncate case Weights):将观测量权数的非整数

部分的尾数舍去,化为整数。

l 无调节(No adjustments):不对计数数据进行调整。

用户在“交叉表:单元显示”对话框中进行选择后,单击【继续】(Continue)

按钮,即可返回“交叉表”主对话框。一般情况下,对“交叉表:单元显示”

对话框的选项都默认为系统默认值,不作调整。

05

单击【格式】(Format)按钮,打开“交叉表:表格格式”(Crosstabs:T

able Format)对话框,如图3-17所示。

图3-17 “交叉表:表格格式”对话框

在该对话框中,用户可以指定列联表的输出排列顺序。对话框中各选项的具体

意义如下:

在行序(Row Order)栏中有如下两个选项:

l 升序(Ascending):系统默认,以升序显示各变量值;

l 降序(Descending):以降序显示各变量值。

用户在该对话框中进行选择后,单击【继续】(Continue)按钮,即可返回“交

叉表”主对话框。

06

在“交叉表”对话框中单击【确定】(OK)按钮,可在输出窗口中得到数据

概述、交叉列联表、卡方检验表、交叉分组下频率分布柱形图、相对危险性估

计等图表。

3.6 比率分析

比率分析主要用于对两个变量间变量值的比率变化进行描述分析,适用于定距

型变量(scale)。例如,可以对受处分的学生和没受处分的学生的上网时间与

用计算机的时间进行比率分析。

比率分析生成比率变量,并对该比率变量计算基本描述性统计量(如均值、中

位数、标准差、全距等),进而刻画出比率变量的集中趋势和离散程度。除此

之外,SPSS17.0还提供了其他对比描述指标,大致也属于集中趋势描述指标和

离散程度描述指标的范畴。

01

打开数据文件,选择【分析】(Analyze)菜单,单击【描述统计】(Descr

iptive Statistics)命令下的【比率】(Ratio)命令。打开“比值统计量”

(Ratio Statistics)对话框(软件翻译为“比值”,但准确的术语应是“比

率”),如图3-18所示。

图3-18 “比值统计量”主对话框

在该主对话框中,左边的变量列表为原变量列表,通过单击按钮可选择一个

或者几个变量进入右边的“分子”(Numerator)变量列表框、“分母”(Deno

minator)变量列表框和“组变量”(Group Variable)列表框中。进行不同组

间的比率比较时,需要将变量分组,将变量选择到“组变量”(Group Variabl

e)列表框中后,可以选择将变量按照分组变量进行升序或者降序排列。

“比值统计量”对话框的左下角有如下两个复选框:

l 显示结果(Display results,系统默认)

l 将结果保存到外部文件(Save results to external file):如果

选择该项,【文件】(File)按钮被激活,单击【文件】(File)按

钮可将输出结果保存至用户指定的位置。

该对话框的右下角是【统计量】(Statistics)按钮,单击它将打开“比率统

计量:统计量”(Ratio Statistics:Statistics)对话框。

02

单击【统计量】(Statistics)按钮,打开“比率统计量:统计量”对话框,

如图3-19所示。

图3-19 “比率统计量:统计量”对话框

在该对话框中,用户可以选择比率变量计算基本描述性统计量(如均值、中位

数、标准差、全距等),并描述比率变量的集中趋势和离散程度。对话框中各

选项的具体意义如下:

(1)集中趋势(Central Tendency)栏(复选项):

l 中位数(Median)

l 均值(Mean)

l 权重均值(Weighted Mean):指两变量均值的比。

l 置信区间(Confidence intervals):默认置信区间的置信度为95%。

(2)离散(Dispersion)栏(复选项)

l AAD(Average Absolute Deviation,平均绝对离差),其计算公式

为:

(3.14)

其中,

R

i

是比率数,

M

是比率变量的中位数,

N

为样本数。

l COD(Coefficient of Dispersion,离散系数),其计算公式为:

(3.15)

l PRD(Price-related Differential,相关价格微分):是比率均值

与加权比率均值的比。

l 中位数居中COV(Median Centered COV):计算公式为:

(3.16)

l 均值居中COV(Mean Centered COV):通常意义下的变异系数,即

标准差除以均值。

(3)集中指数(Concentration Index)栏:

l 在以下比例之间(Ratios Between):通过在低比例(Low Proport

ion)和高比例(High Proportion)后面的文本框中输入数值,可以

控制比率的范围。输入后,单击【添加】(Add)按钮,将对应的比

率范围添加到方框内的列表框中,利用【更改】(Change)按钮和【删

除】(Remove)按钮,可以对列表框中的选项进行修改和删除。

l 在以下比例之内(Ratios Within):通过在中位数的%(% of medi

an)前面的文本框中输入数值,可以控制比率相对于中位数的范围。

输入后,单击【添加】(Add)按钮,将对应的比率限制条件添加到

方框内的列表框中,利用【更改】(Change)按钮和【删除】(Rem

ove)按钮,可以对列表框中的选项进行修改和删除。

用户在本对话框中进行选择后,单击【继续】(Continue)按钮,即可返回“比

值统计量”(Ratio Statistics)主对话框。

03

在“比值统计量”主对话框中单击【确定】(OK)按钮,可在输出窗口中得

到分组描述结果和比率分析结果等图表。

3.7 P-P图和Q-Q图

P-P图是根据变量的累积比例与指定分布的累积比例之间的关系所绘制的图形。

通过P-P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P图

中各点近似呈一条直线。如果P-P图中各点不呈直线,但有一定规律,可以对

变量数据进行转换,使转换后的数据更接近指定分布。

Q-Q图同样可以用于检验数据的分布,所不同的是,Q-Q图是用变量数据分布的

分位数与所指定分布的分位数之间的关系曲线来进行检验的。

由于P-P图和Q-Q图的用途完全相同,只是检验方法存在差异,SPSS17.0中用

于做出P-P图的对话框和用于做出Q-Q图的对话框完全一致,下面将对两者统

一加以说明。

具体操作步骤如下:

打开数据文件,选择【分析】(Analyze)菜单,单击【描述统计】(Descript

ive Statistics)命令下的【P-P图】(P-P Plots)或【Q-Q图】(Q-Q Plots)

命令。“P-P图”(P-P Plots)、“Q-Q图”(Q-Q Plots)的对话框分别如图

3-20和图3-21所示。

图3-20 “P-P图”对话框

图3-21 “Q-Q图”对话框

在“P-P图”(P-P Plots)或“Q-Q图”(Q-Q Plots)对话框中,最左边的变

量列表为原变量列表,通过单击按钮可选择一个或者几个变量进入位于对话

框中间的“变量”(Variables)列表框中。根据这些变量数据可创建P-P图或

Q-Q图,并进行分布检验。

“P-P图”或“Q-Q图”对话框的中下方和右方有5个选项栏,选项栏中各选项

的意义如下:

(1)转换(Transform)栏(复选项):

l 自然对数转换(Natural log transform):选择此项,对当前变量

的数据取自然对数,即将原有变量转换成以自然数e为底的对数变

量。

l 标准值(Standardize values):选择此项,将当前变量的数据转

换为标准值,即转换后变量数据的均值为0,方差为1。

l 差分(Difference):选择此项,对当前变量的数据进行差分转换,

即利用变量中连续数据之间的差值来转换数据。选择此项以后,后面

的文本框变为可用,在其中输入一个正整数,以确定转换的差分度,

默认值为1。

l 季节性差分(Seasonally difference):用于确定指明计算时间序

列的季节差分。只有在对当前变量的数据序列定义了周期(通过主菜

单中的【数据】(Data)菜单中的【定义日期】(Define Dates)选

项定义)以后才可用,如果当前周期为0,将不能计算季节差分。选

择此项,在后面的文本框中输入正整数,然后根据该正整数所确定的

范围来计算该范围内数据的差值,并用该差值来转换原数据。

需要注意的是,这些数据转换并不改变变量中的变量值,只影响正态概率图。

(2)检验分布(Test Distribution)栏:可选择不同的分布类型,检验变量

数据是否符合所选分布。单击选项分布栏下的箭头可选择不同的分布类型。SPS

S默认的检验分布是正态分布(Normal)。

P-P图(或Q-Q图)可检验的分布包括:

贝塔分布(Beta) T分布(Stud

ent t)

卡方分布(Chi-square) 伽马分布(Gamma)

指数分布(Exponential) 半正态分布(Half-normal)

Logistic分布(Logistic) 拉普拉斯分布(Laplace)

对数正态分布(Lognormal) 威布尔分布(Weibull)

正态分布(Normal) 均匀分布(Uniform)

帕累托分布(Pareto)

dt:在该文本框中输入正整数,表示所选分布的自由度。

(3)分布参数(Distribution Parameters)栏:在该栏中可输入所选分布类

型的参数,选择的分布不同,参数输入窗口也不同。

l 从数据中估计(Estimate from data):为系统默认选项。选择此

项,系统将自动从数据中推测数据分布的参数,否则就要在该选项下

方的参数框中根据需要自行指定。

l 位置(Location)参数窗口:选择正态分布时,用户自行输入位置

参数。

l 比例(Scale)参数窗口:选择正态分布时,用户自行输入比例参数。

(4)比例估计公式(Proportion Estimation Formula)栏(单选项组)

l Blom方法:计算公式为

(3.17)

l Rankit方法:计算公式为

(3.18)

l Tukey方法:计算公式为

(3.19)

l Van der Waerden方法:计算公式为

(3.20)

以上公式中,

n

表示观测量的数目,

r

是从1到

n

的秩次。

(5)为结指定的秩(Rank Assigned to Ties)栏(单选项组):

l 均值(Mean):用连接值的平均秩指定顺序。

l 高(High):用连接值的最大秩指定顺序。

l 低(High):用连接值的最小秩指定顺序。

l 强制打开结(Break ties arbitrarily):忽略观测量权重的影响。

3.8 图表绘制

进行数字统计分析时,有时我们需要绘制统计图表,把资料所反映的变化趋势、

数量多少、分布状态和相互关系等形象直观地表现出来,以便于读者的阅读、

比较和分析。SPSS的【图形】(Graphs)菜单提供了绘制图表的功能,主要包

括3个子菜单:【图表建立】(Chart Builder)命令相当于图表向导,它对S

PSS的绘图功能作了粗略的介绍,初学者可以大致了解SPSS的绘图能力;【交

互图表】(Interactive)命令主要涵盖了SPSS各种复杂的交互性图表;【旧

对话框】(Legacy Dialogs)命令主要包括多种SPSS传统的常用的统计报表,

下面重点讲解。

3.8.1 条形图

条形图(Bar Charts),又称带形图或柱形图,它是利用相同宽度的条形的长

短或高低来表现统计数据大小或变动的统计图。

绘制条形图的具体操作步骤如下:

01

打开【图形】(Graphs)菜单,选择【旧对话框】(Legacy Dialogs)命令

下的【条形图】(Bar Charts)命令,SPSS将弹出“条形图”(Bar Charts)

导航对话框,如图3-22所示。

图3-22 “条形图”导航对话框

在该导航对话框中,用户可以选择条形图的类型,并定义条形图中数据的表达

方式。

SPSS将条形图大致分为3种类型:

l 简单(Simple):单式条形图,各个条形相互独立;

l 复式条形图(Clustered):分组条形图,每组的相邻两个或多个条

形左右连接,以方便进行组间比较;

l 堆积面积图(Stacked):分段条形图,同一组的条形图上下连接,

以方便进行组与组之间的互相比较。

在图3-22下部的“图表中的数据为”(Data in Chart are)栏,用户可以选

择的条形图中数据的表达类型如下:

l 个案组摘要(Summaries for groups of cases):用分类值作图,

条形图中每一条代表观测量的一个分类;

l 各个变量的摘要(Summaries of separate variables):用变量值

作图,条形图中每一条代表一个变量;

l 个案值(Values of individual cases):用单元值作图,条形图

中每一条代表一个观察值。

通过以上3个条形图类型和3个数据的表达方式的不同搭配,SPSS可以生成9

种不同的条形图。本书以用户选择“简单”(Simple)条形图和“个案组摘要”

(Summaries for groups of cases)为例,阐述条形图的绘制步骤,如果用户

需要制作其他类型的条形图,请参看简单条形图绘制的类似步骤。

02

单击【定义】(Define)按钮,进入正式的条形图定义对话框“定义简单条

形图:个案组摘要”(Define Simple Bar:Summaries for groups of cases)

对话框,如图3-23所示。根据用户所选的条形图类型和数据表达方式的不同,

出现的对话框名称也不同,但对话框的主体内容大致相同。

图3-23 “定义简单条形图:个案组摘要”对话框

在该对话框中,用户可以选择条形图绘制的相关细节。

“条的表征”(Bar Present)栏中,用户可以选择以下条形图中条所代表的统

计量:

l 个案数(N of cases):按照分组变量分组后各组的观测量个数;

l 个案数的%(% of cases):按照分组变量分组后各组的观测量个数

占总观测量个数的百分比;

l 累积个数:观测量数的累计数目;

l 累积%:观测量数的累计百分比;

l 其他统计量(Other statistics):用户可以自行定义条形图中的

统计量。选中该选项,下面的“变量”(Variable)列表框被激活,

用户需要通过单击按钮从左边原变量中选择一个分析变量进入“变

量”(Variable)列表框中,然后单击【更改统计量】(Change St

atistics)按钮,SPSS将弹出“统计量”(Statistic)对话框,如

图3-24所示。

图3-24 “统计量”对话框

在该对话框中,用户可以选择需要计算的描述统计量作为条形图中的统计量。

对话框中的描述统计量包括:

l 值的均值(Mean of values):按照分组变量分组后,以分析变量

的均值作为条形图中的统计量;

l 值的中位数(Median of values):按照分组变量分组后,以分析

变量的中位数作为条形图中的统计量;

l 值的众数(Mode of values):按照分组变量分组后,以分析变量

的众数作为条形图中的统计量;

l 个案数(Number of cases):按照分组变量分组后,以分析变量的

样本个数作为条形图中的统计量;

l 值的和(Sum of values):按照分组变量分组后,以分析变量数据

的总和作为条形图中的统计量;

l 标准差(Standard deviation):按照分组变量分组后,以分析变

量的标准差作为条形图中的统计量;

l 方差(Variance):按照分组变量分组后,以分析变量的方差作为

条形图中的统计量;

l 最小值(Minimum value):按照分组变量分组后,以分析变量的最

小值作为条形图中的统计量;

l 最大值(Maximum value):按照分组变量分组后,以分析变量的最

大值作为条形图中的统计量;

l 累计求和(Calculative sum):按照分组变量分组后,以分析变量

的累计总和作为条形图中的统计量。

在该对话框的中部,用户可以在“值”(Value)文本框中输入数值或者百分数,

然后选择相关选项,SPSS将对数值或百分数上侧或下侧的观测量按照大小进行

筛选。

在该对话框的下部,用户可以在“低”(Low)和“高”(High)文本框中输入

数值或者百分数,然后选择对应选项,SPSS将按照大小对观测量在限定范围内

进行筛选。

对话框底部的“值是组中点”(Values are grouped midpoints)复选框只有

在用户选择“值的中位数”(Median of values)或者“百分位”(Percentil

e)时,才被激活。选中该选项,则表明数据分布为频数分布表的格式,输出的

条形图中的统计量为分组的中值。

选择条形图中的统计量后,单击【继续】(Continue)按钮,即可返回到“定

义简单条形图:个案组摘要”主对话框中。

接下来,需要指定做图变量。在“类别轴”(Category Axis)列表框中,用户

需要通过单击按钮从左边原变量中选择一个变量作为分类变量(也称为分组

变量)。条形图中每个条形的长度分别代表对应各组的统计量的值。

模板(Template):用户可以选中该选项,并单击【文件】(File)按钮选择

模板文件,作为散点图的格式模板。

03

单击【标题】(Titles)按钮,打开“标题”(Titles)对话框,如图3-25

所示。

图3-25 “标题”对话框

在该对话框中,用户可以定义散点图的标题、子标题和脚注。

(1)标题(Title)和子标题(Subtitle):通过输入,用户可以定义两行标

题和一行子标题。标题和子标题将在散点图上方显示。用户也可以在结果输出

窗口中定义标题。

(2)脚注(Footnote):通过输入,用户可以定义两行脚注,脚注将在散点图

下方显示。

输入标题后,单击【继续】(Continue)按钮,即可返回“定义简单条形图:

个案组摘要”主对话框中。

04

单击【选项】(Options)按钮,打开“选项”(Options)对话框,如图3-

26所示。

图3-26 “选项”对话框

在该对话框中,用户可以指定缺失值的处理方式和误差条的设定形式。

(1)缺失值(Missing Values)栏:用户可以定义分析中对缺失值的处理方式,

包括按列表排除个案(Exclude cases listwise)和按变量顺序排除个案(Exc

lude cases variable by variable)。为尽可能充分利用数据,SPSS默认选择

前者。

(2)误差条图的表征(Error Bars Represent)栏:用户可以选择设定置信区

间(Confidence intervals)、标准误(Standard Error)或者标准差(Stand

ard deviation)条件,并显示误差条图。

指定缺失值的处理方式和误差条的设定形式后,单击【继续】(Continue)按

钮,即可返回“定义简单条形图:个案组摘要”主对话框中。

05

在“定义简单条形:个案组摘要”主对话框中,单击【确定】(OK)按钮,

即可在结果输出窗口中得到简单条形图。

3.8.2 线图

线图(Line Charts),又称曲线图,它是利用点的高低来表明数据升降情况的

一种统计图。通过将不同阶段的数据点连接,可以更清晰地表明数据的变化趋

势。线图主要用于时间序列分析、数据分配情况比较和两变量依存关系的分析

等。

绘制线图的具体操作步骤如下:

01

打开【图形】(Graphs)菜单,选择【旧对话框】(Legacy Dialogs)命令

下的【线图】(Line Charts)命令,SPSS将弹出“线图”(Line Charts)导

航对话框,如图3-27所示。

图3-27 “线图”导航对话框

在该导航对话框中,用户可以选择线图的类型,并定义线图中数据的表达方式。

SPSS将线图大致分为3种类型:

(1)简单(Simple):单线图,一个图形中只有一条水平走向的折线;

(2)多线线图(Multiple):多线图,一个图形中有多条水平走向的折线;

(3)垂直线图(Drop-line):垂线图,一个图形中有多组水平走向的数据,

但在水平方向上不予以连接,而只是在垂直方向上将同一时间点的数据予以连

接。

图表中的数据为(Data in Chart are)栏:用户可以选择以下的条形图中的数

据表达类型:

l 个案组摘要(Summaries for groups of cases):用分类值作图,

线图中每一条线代表观测量的一个分类;

l 各个变量的摘要(Summaries of separate variables):用变量值

作图,线图中每一条线代表一个变量;

l 个案值(Values of individual cases):用单元值作图,线图中

每一条线代表一个观察值。

通过以上3个线图类型和3个数据表达类型的不同搭配,SPSS可以生成9种不

同的线图。本书以用户选择“简单”线图和“个案组摘要”为例,阐述线图的

绘制步骤。

02

单击【定义】(Define)按钮,进入正式的定义对话框“定义简单线图:个

案组摘要”(Define Simple Line:Summaries for groups of cases)对话框,

如图3-28所示。根据用户所选的线图类型和数据表达类型的不同,出现的对话

框名称也不同。

在该对话框中,用户首先需要指定绘图变量,即通过单击按钮从左边原变量

中选择多个需要绘制折线图的变量进入右边的“线的表征”(Lines Represent)

中。绘图变量的数值将在线图的纵轴上表示。

图3-28 “定义简单线图:个案组摘要”对话框

同时,用户需要指定分类变量。用户可以选择以“个案数”(Case number),

即观测量的编号作为分类变量,也可以选中“变量”(Variable)选项,然后

单击按钮选择一个变量作为分类变量。例如,在时间序列分析中,用户就可

以将时间变量作为分类变量。分类变量的数值将在线图的横轴上表示。

本对话框的其他部分及单击【标题】(Title)按钮所弹出的“标题”(Title)

对话框都与“定义简单条形图:个案组摘要”(Define Simple Bar:Summarie

s for Groups of Cases)对话框完全相同,此处不再赘述。

03

在“定义简单线图:个案组摘要”主对话框中,单击【确定】(OK)按钮,

即可在结果输出窗口中得到线图。

3.8.3 面积图

面积图(Area Charts),又称区域图,是用面积来表现连续性的频数分布的统

计图。面积越大,频数越多,反之亦然。制作面积图的原始数据大多为频数分

布表。

绘制面积图的具体操作步骤如下:

01

打开【图形】(Graphs)菜单,选择【旧对话框】(Legacy Dialogs)命令

下的【面积图】(Area Charts)命令,SPSS将弹出“面积图”(Area Charts)

导航对话框,如图3-29所示。

图3-29 “面积图”导航对话框

在该导航对话框中,用户可以选择面积图的类型,并定义面积图中数据的表达

方式。

SPSS将面积图大致分为以下两种类型:

(1)简单(Simple):简单面积图,图形中只有一个区域表示频数大小;

(2)堆积面积图(Stacked):图形由多个不同颜色的区域从下到上堆积而成,

不同的区域表示不同类型的频率大小。

“面积图”(Area Charts)导航对话框中的“图表中的数据为”(Data in Ch

art are)栏与条形图、线图的导航对话框该栏的内容相同,不再赘述。

通过以上两个面积图类型和三个数据表达类型的不同搭配,SPSS可以生成6种

不同的面积图。本书以用户选择“简单”面积图和“个案组摘要”为例,阐述

面积图的绘制步骤。

02

单击【定义】(Define)按钮,进入“定义简单面积图:个案组摘要”(De

fine Simple Area:Summaries for groups of cases)对话框,如图3-30所

示。根据用户所选的面积图类型和数据表达方式的不同,出现的对话框名称也

不同。

图3-30 “定义简单面积图:个案组摘要”对话框

本对话框与“定义简单条形图:个案组摘要”(Define Simple Bar:Summarie

s for Groups of Cases)对话框几乎完全相同,此处不再赘述。

03

在本主对话框中,单击【确定】(OK)按钮,即可在结果输出窗口中得到面

积图。

3.8.4 饼形图

饼形图(Pie Charts)是用扇形的大小来表示数值大小的统计图。饼形图简单

易懂,并且便于比较,因此,饼形图的制图过程使用最为广泛。

绘制饼形图的具体操作步骤如下:

01

打开【图形】(Graphs)菜单,选择【旧对话框】(Legacy Dialogs)命令

下的【饼图】(Pie Charts)命令,SPSS将弹出“饼图”(Pie Charts)导航

对话框,如图3-31所示。

在该导航对话框中,用户可以定义饼形图中数据的表达方式。

“饼图”导航对话框中只有“图表中的数据为”(Data in Chart are)一栏,

并且与条形图、线图、面积图的导航对话框该栏的内容相同,此处不再赘述。

根据3个不同的数据表达方式,SPSS可以生成3种不同的面积图。本书以用户

选择“个案组的摘要”(Summaries for groups of cases)为例,阐述饼形图

的绘制步骤,如果用户需要制作其他类型的饼图,请举一反三学习类似的步骤。

02

单击【定义】(Define)按钮,进入“定义饼图:个案组摘要”(Define P

ie:Summaries for groups of cases)对话框,如图3-32所示。根据用户所

选的数据表达方式的不同,出现的对话框名称也不同。

图3-31 “饼图”导航对话框 图3-3

2 “定义饼图:个案组摘要”对话框

在本对话框中,用户可以选择饼形图绘制的相关细节。

分区的表征(Bar Present)栏:用户可以选择饼形图中扇形切片所代表的统计

量。

l 个案数(N of cases):按照分组变量分组后各组的观测量个数。

l 个案数的%(% of cases):按照分组变量分组后各组的观测量个数

占总观测量个数的百分比。

l 变量和(Sum of variables):按照分组变量分组后,用户可以选

择另一变量并以该变量的总和作为切片统计量的表达方式。选中该选

项,下面的“变量”(Variable)列表框被激活,用户需要通过单击

按钮从左边原变量中选择一个计算总和的变量进入“变量”(Var

iable)列表框中。

在“定义分区”(Define Slices by)列表框中,用户需要单击

原变量列表中指定一个分类变量作为不同扇形的识别变量。

该对话框的其他部分及【标题】(Title)按钮、【选项】(Options)按钮都

与“定义简单条形图:个案组摘要”(Define Simple Bar:Summaries for Gr

oups of Cases)对话框完全相同,此处不再赘述。

按钮从左边

03

在本对话框中,单击【确定】(OK)按钮,即可在结果输出窗口中得到饼形

图。

3.8.5 高低图

高低图(High-Low Charts)是用多个垂直线段来表示数值区域的统计图,例如

一组测定值的范围(最小值—最大值)、95%置信区间(下限—上限)、

96·SD(低值—均值—高值)等。

绘制高低图的具体操作步骤如下:

±1.

01

打开【图形】(Graphs)菜单,选择【旧对话框】(Legacy Dialogs)下的

【高低图】(High-Low Charts)命令,SPSS将弹出“高–低图”(High-Low

Charts)导航对话框,如图3-33所示。

图3-33 “高–低图”导航对话框

在该导航对话框中,用户可以选择高低图的类型,并定义高低图中数据的表达

方式。

SPSS将高低图大致分为如下5种类型:

(1)简单高低关闭(Simple high-low-close):一个图形中只有一组高低图,

高值与低值之间用垂直线段连接。闭合(close)是指用户指定的一个特殊变量,

特殊变量的数值可以在图中以小圆圈的形式标识出来。

(2)群集高低关闭(Clustered high-low-close):一个图形中有多组高低图,

每组高值与低值之间用垂直线段连接,不同组别的高低图用不同颜色的线段表

示。

(3)简单范围栏(Simple range bar):一个图形中只有一组高低图,高值与

低值之间用垂直条形连接。

(4)群集范围栏(Clustered range bar):一个图形中有多组高低图,每组

高值与低值之间用垂直条形连接,不同组别的高低图用不同颜色的条形表示。

(5)差别面积(Difference):一个图形中只有一组高低图,根据分组变量,

对应的高值与高值连接,低值与低值连接,两条折线中形成面积区域。

该导航对话框中的“图表中的数据为”(Data in Chart are)栏与其他图形的

导航对话框的该栏内容相同,此处不再赘述。

通过以上5个高低图类型和3个数据表达方式的不同搭配,SPSS可以生成15种

不同的面积图。本书以用户选择“简单高低关闭”(Simple high-low-close)

和“各个变量的摘要”(Summaries of separate variables)为例,阐述高低

图的绘制步骤。

02

单击【定义】(Define)按钮,进入“定义高-低-闭合:各个变量的摘要”

(Define Simple high-low-close:Summaries of separate variables)对话

框,如图3-34所示。根据用户所选的高低图类型和数据表达方式的不同,出现

的对话框名称也不同。

图3-34 “定义高-低-闭合:各个变量的摘要”对话框

在该对话框中,用户可以选择高低图绘制的相关细节。

用户通过单击

量列表框中:

(1)高(High):作为高值的变量;

(2)低(Low):作为低值的变量;

(3)闭合(Close):用户需要指定一个变量,该变量的数值可以在图中以小

圆圈的形式标识出来。

以上3个变量,用户都可以选择指定的统计量作为显示的数值,只要在对应列

表框中选中变量,然后单击【更改统计量】(Change Statistics)按钮,SPSS

就会弹出“统计量”(Statistic)对话框。默认的统计量是“数据的平均值”

(Mean of values)。

按钮,可从左边原变量中选择如下3个变量进入右边对应的变

在“类别轴”(Category Axis)列表框中,用户同样需要通过单击按钮从左

边原变量中选择一个变量作为分类变量(也称为分组变量),以保证高值、低

值、闭合值的一一对应。

该对话框的其他部分及【标题】(Title)按钮、【选项】(Options)按钮都

与“定义简单条形图:个案组摘要”(Define Simple Bar:Summaries for Gr

oups of Cases)对话框完全相同,此处不再赘述。

03

在“定义高-低-闭合:各个变量的摘要”主对话框中单击【确定】(OK)按

钮,即可在结果输出窗口中得到高低图。

3.8.6 箱图

箱图(Boxplot),又称为箱锁图,是表示样本数据的中位数、四分位数和极端

值的统计图形。在箱图中,最上方和最下方的线段分别表示数据的最大值和最

小值,其中箱图的上方和下方的线段分别表示第三四分位数和第一四分位数,

箱图中间的粗线段表示数据的中位数。另外,箱图中在最上方和最下方的星号

和圆圈分别表示样本数据中的极端值。

绘制箱图的具体操作步骤如下:

01

打开【图形】(Graphs)菜单,选择【旧对话框】(Legacy Dialogs)命令

下的【箱图】(Boxplot)命令,SPSS将弹出“箱图”(Boxplot)导航对话框,

如图3-35所示。

在“箱图”(Boxplot)导航对话框中,用户可以选择箱图的类型,并定义箱图

中数据的表达方式。

SPSS将箱图大致分为以下两种类型:

l 简单(Simple):一个图形中有多个箱,各个箱相互独立;

l 复式条形图(Clustered):一个图形中有多个箱,多个箱之间按照

分组变量分成若干组,相同组别的箱集中放置,以方便用户进行比较。

图3-35 “箱图”导航对话框

图表中的数据为(Data in Chart are)栏:用户可以选择如下的数据表达类型:

(1)个案组摘要(Summaries for groups of cases):用分类值作图,箱图

中每一条线代表观测量的一个分类;

(2)各个变量的摘要(Summaries of separate variables):用变量值作图,

箱图中每一条线代表一个变量。

通过以上2个箱图类型和2个数据表达方式的不同搭配,SPSS可以生成4种不

同的箱图。本书以用户选择“简单”箱图和“个案组摘要”为例,阐述箱图的

绘制步骤。

02单击【定义】(Define)按钮,进入“定义简单箱图:个案组摘要”(Defi

ne Simple Boxplot:Summaries for groups of cases)对话框,如图3-36所

示。根据用户所选的箱图类型和数据表达方式的不同,出现的对话框名称也不

同,但对话框的主体内容大致相同。

图3-36 “定义简单箱图:个案组摘要”对话框

在该对话框中,用户可以选择以下箱图绘制的相关细节:

(1)“变量”(Variable)列表框:用户需要通过单击按钮从左边原变量中

选择一个变量作为分析变量,分析变量的数据将作为箱图中各四分位点的依据;

(2)“类别轴”(Category Axis)列表框:用户需要选择一个变量作为分类

变量(也称为分组变量),SPSS将按照分组变量所分的组别决定箱图的个数;

(3)“标签个案依据”(Label Cases by)列表框:非必选项,用户可以选择

一个变量作为标识变量,以保证分析变量与分类变量的一一对应。

该对话框的其他部分及【选项】(Options)按钮所弹出的“选项”(Options)

对话框都与“定义简单条形图:个案组摘要”(Define Simple Bar:Summarie

s for Groups of Cases)对话框完全相同,此处不再赘述。

03

在主对话框中,单击【确定】(OK)按钮,即可在结果输出窗口中得到箱图。

3.8.7 直方图

直方图(Histogram)是用条形的长短来表示连续性频数大小的统计图。其统计

意义与面积图(Area Charts)相似,但是面积图能进行多组资料的比较(通过

堆积式面积图),而直方图无此项功能。另外,由于直方图也是用条形的长短

来表示统计意义,故其外观上与条形图类似。但由于条形图是分析非连续频数,

而直方图是分析连续性频数,因此,条形图的条形之间存在一定间隔,而直方

图的条形之间不存在间隔。

绘制直方图的具体操作步骤如下:

01

打开【图形】(Graphs)菜单,选择【旧对话框】(Legacy Dialogs)命令

下的【直方图】(Histogram)命令,SPSS将弹出“直方图”(Histogram)对

话框,如图3-37所示。

图3-37 “直方图”对话框

02

在该对话框中,用户可以选择直方图绘制的相关细节。

用户需要通过单击按钮从左边原变量中选择一个变量作为分析变量进入“变

量”(Variable)列表框中。SPSS自动将分析变量进行频数分析,并根据各个