2024年4月2日发(作者:)
一、图示法
1、P-P图
以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵
坐标,把样本值表现为直角坐标系中的散点。假如资料服从整体分布,那么样本
点应围绕第一象限的对角线分布。
2、Q-Q图
以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐
标,把样本表现为指教坐标系的散点。假如资料服从正态分布,那么样本点应该
呈一条围绕第一象限对角线的直线。
以上两种方法以Q-Q图为佳,效率较高。
3、直方图
判断方法:是否以钟形分布,同时可以选择输出正态性曲线。
4、箱式图
判断方法:观测离群值和中位数。
5、茎叶图
类似与直方图,但本质不同。
二、计算法
1、偏度系数〔Skewness〕和峰度系数〔Kurtosis〕
计算公式:
g
1
表示偏度,g
2
表示峰度,通过计算g1和g2及其标准误σ
g1
及σ
g2
然后作U
检验。两种检验同时得出U
0.05
=1.96,即p>0.05的结论时,才可以认为该组资
料服从正态分布。由公式可见,局部文献中所说的“偏度和峰度都接近0……可以
认为……近似服从正态分布〞并不严谨。
2、非参数检验方法
非参数检验方法包括Kolmogorov-Smirnov检验〔D检验〕和Shapiro- Wilk
〔W
检验
〕。
SAS中规定:当样本含量
n
≤
2000
时
,
结果以Shapiro – Wilk
〔W
检验
〕
为准
,
当样本含量
n >2000
时
,
结果以Kolmogorov – Smirnov
〔D
检验
〕
为准。
SPSS中那么这样规定:〔1〕假如指定的是非整数权重,那么在加权样本大
小位于3和50之间时,计算 Shapiro-Wilk 统计量。对于无权重或整数权重,在
加权样本大小位于3 和 5000 之间时,计算该统计量。由此可见,局部SPSS教
材里面关于“Shapiro – Wilk适用于样本量3-50之间的数据〞的说法是在是理解片
面,误人子弟。〔2〕单样本 Kolmogorov-Smirnov 检验可用于检验变量〔例如
income〕是否为正态分布。
对于此两种检验,假如P值大于0.05,说明资料服从正态分布。
三、SPSS操作例如
SPSS中有很多操作可以进展正态检验,在此只介绍最主要和最全面最方便的
操作:
1、工具栏--分析—描绘性统计—探究性
2、选择要分析的变量,选入因变量框内,然后点选图表,设置输出茎叶图
和直方图,选择输出正态性检验图表,注意显示〔Display〕要选择双项〔Both〕。
3、Output结果
〔1〕Descriptives:描绘中有峰度系数和偏度系数,根据上述判断标准,数
据不符合正态分布。
S
k
=0,K
u
=0时,分布呈正态,Sk>0时,分布呈正偏态,Sk<0时,分布呈负
偏态,时,Ku>0曲线比拟陡峭,Ku<0时曲线比拟平坦。由此可判断本数据分布
为正偏态〔朝左偏〕,较陡峭。
〔2〕Tests of Normality:D检验和
W
检验均显示数据不服从正态分布,当
然在此,数据样本量为1000,应以W检验为准。
〔3〕直方图
直方图验证了上述检验结果。
〔4〕此外还有茎叶图、P-P图、Q-Q图、箱式图等输出结果,不再赘述。结
果同样验证数据不符合正态分布。


发布评论