您好,欢迎来到尚车旅游网。
搜索
您的当前位置:首页spss秩和检验

spss秩和检验

来源:尚车旅游网
研究生SPSS统计——秩和检验

秩和检验

前面介绍的均数的区间估计及假设检验,都是要求个体变量值服从正态分

布,或根据中心极限定理,当样本较大时,样本均数服从正态分布。这种要求样本来自总体分布型是已知的,在此基础上对总体参数进行估计或检验,称为参数统计(parametric statistics)。但在医学研究中,许多数据不符合参数统计的要求,这时有两种处理的方法。一是,进行数据转换,使其符合参数统计方法的要求。二是,选择非参数检验方法,非参数检验(non-parametric test)方法是对样本来自的总体分布不作要求(如不要求样本来自正态分布)的一类假设检验方法。

非参数检验的主要优点是对样本的总体分布不作要求,适用的范围广,尤其是当变量中有不确定数值时,如<0.5mg,可用非参数检验。同时,非参数检验方法存在其致命的缺点,其检验功效低于相应的参数统计方法。

因此,如果数据符合参数统计的要求首选参数统计方法;如果数据不符合参数统计的要求有两个选择,一是选择非参数检验方法。下面介绍了属于非参检验的两种秩和检验(rank sum test)方法。二是,将数据经过变换使其符合参数统计方法,再选择参数统计方法,本节介绍了几种数据变换方法。 应用条件

①总体分布形式未知或分布类型不明; ②偏态分布的资料:

③等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示; ④不满足参数检验条件的资料:各组方差明显不齐。 ⑤数据的一端或两端是不确定数值,如“>50mg”等。

第1页/共20页

研究生SPSS统计——秩和检验

一、配对资料的Wilcoxon符号秩和检验(Wilcoxon signed-rank test) 例1 对10名健康人分别用离子交换法与蒸馏法,测得尿汞值,如表9.1的第(2)、(3)栏,问两种方法的结果有无差别?

表1 10名健康人用离子交换法与蒸馏法测定尿汞值(μg/l) 样品号 (1) 1 2 3 4 5 6 7 8 9 10

离子交换法 (2) 0.5 2.2 0.0 2.3 6.2 1.0 1.8 4.4 2.7 1.3

蒸馏法 (3) 0.0 1.1 0.0 1.3 3.4 4.6 1.1 4.6 3.4 2.1

差值 (4)=(2)(3) 0.5 1.1 0.0 1.0 2.8 -3.6 0.7 -0.2 -0.7 -0.8

秩次 (5) 2 7 — 6 8 -9 3.5

-1 -3.5 -5 T+=+26.5 T-=-18.5

差值先进行正态性及方差齐性检验,看是否可以做参数检验,其检验效能高于非参数检验。(下同)

H0:Md(差值的总体中位数)=0 H1:Md≠0 α=0.05 T++T-=1+2+3+…n=n(n+1)/2 ① 小样本(n≤50)--查T界值表

第2页/共20页

研究生SPSS统计——秩和检验

基本思想:如果无效假设H0成立,则正负秩和的绝对值从理论上说应相等,都等于n(n+1)/4,既使有抽样误差的影响正负T值的绝对值相差也不应过大。反过来说,如果实际计算出的正负T值绝对值相差很大,我们只能认为H0成立的可能性很小。

界值的判断标准 若下限表中概率值

若T≤下限或T≥上限,则P值≤表中概率值 ② 大样本时(n>50),正态近似法(Z检验)

基本思想:假定无效假设H0成立,则正负秩和的绝对值应相等,随着n增大T逐渐趋近于均数等于n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布。所以可用近似正态法计算Z值。即:

Z|Tn(n1)/4|0.5n(n1)(2n1)24

*校正公式:当相同秩次个数较多时

Z|Tn(n1)/4|0.5n(n1)(2n1)(ttj)24483j

tj:第j个相同秩次的个数 SPSS: 建立变量名:

第3页/共20页

研究生SPSS统计——秩和检验

录入数值:

统计分析:

第4页/共20页

研究生SPSS统计——秩和检验

分析——非参数检验——两相关样本(配对样本)

结果分析:

第5页/共20页

研究生SPSS统计——秩和检验

表一:第一行:b-a的负秩(Negative Ranks)有5个(右上角的a在表下方有注释),平均秩次为5.3,负秩和为26.5。第二行:正秩,正秩的个数,平均秩次,正秩和。

表二:可用正秩和18.5或负秩和26.5计算,习惯上用较小的秩和计算Z值。p=0.635大于0.05,不拒绝H0,还不能认为两种方法有差别。 二、两个样本比较的Wilcoxon秩和检验(Wilcoxon rank sum test) 1.原始数据的两样本比较

例2 某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日数作为观察指标,试检验两组小鼠生存日数有无差别?

第6页/共20页

研究生SPSS统计——秩和检验

实验组

生存日数 10 12 15 15 16 17 18 20 23 90以上

n1=10

秩次 9.5 12.5 15 16 17 18 19 20 21 22 T1=170

对照组

生存日数 2 3 4 5 6 7 8 9 10 11 12 13 n2=12

秩次 1 2 3 4 5 6 7 8 9.5 11 12.5 14 T2=83

时间资料不服从正态分布

H0:两总体分布位置相同 H1:两总体分布位置不同 a=0.05 记n较小组秩和为T,样本量n1。如果n1=n2,可取任秩和

① 查表法:

查T界值表:n1≤10,n2n1≤10

界值的判断标准: 若下限表中概率值

第7页/共20页

研究生SPSS统计——秩和检验

若T≤下限或T≥上限,则P值≤表中概率值 ② 正态近似法

当n1或n2-n1超出T界值表的范围时,随n增大,T的分布逐渐逼近均数为n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布,所以可用近似正态法计算Z值。即:

Z|T1n1(N1)/2|0.5n1n2(N1)/12

*校正公式(当相同秩次较多时)

ZCZ/c

3 C1-(t3j-tj)/(N-N)SPSS 建立变量名:

录入数值:

第8页/共20页

研究生SPSS统计——秩和检验

统计分析:

第9页/共20页

研究生SPSS统计——秩和检验

结果分析:

Z值为-3.630,p<0.001,拒绝H0

2. 频数表资料(或等级资料)的两样本比较

例3 20名正常人和32名铅作业工人尿棕色素定性检查结果见下表。问铅作业工人尿棕色素是否高于正常人?

人数

结果

正常人 铅作业工人 合计

(1)

(2)

- 

18 2

(3) 8 10

(4) 26 12

(5) 1-26 27-38

13.5 32.5

范围

(6)

(7)=(2)(6)

243 65

(8)=(3)(6) 108 325

秩次

平均秩次

正常人

铅作业工人 秩和

第10页/共20页

研究生SPSS统计——秩和检验

++ +++ ++++ 合计

0 0 0 n1=20

7 3 4 n2=32

7 3 4 52

39-45 46-48 49-52 -

42.0 47.0 50.5 -

0 0 0 T1=308

294 141 202 T2=1070

取n较小组的秩和为T值,用校正公式计算。即:

Z|T1n1(N1)/2|0.5n1n2(N1)/123 ZCZ/c C1-(t3 j-tj)/(N-N)SPSS: 建立变量名:

录入数值:

第11页/共20页

研究生SPSS统计——秩和检验

统计分析:

第12页/共20页

研究生SPSS统计——秩和检验

结果分析:同两个样本比较的Wilcoxon秩和检验

Mann-Whitney Test

RanksVAR00002VAR000011.002.00TotalN203252Mean Rank15.4033.44Sum of Ranks308.001070.00 aTest StatisticsVAR00002Mann-Whitney U98.000Wilcoxon W308.000Z-4.503Asymp. Sig. (2-tailed).000a. Grouping Variable: VAR00001

P<0.001,拒绝H0

第13页/共20页

研究生SPSS统计——秩和检验

三、多个样本比较的秩和检验(Kruskal-Wallis H test) 1.原始数据法

例4 某研究者测定正常人、单纯性肥胖、皮质醇增多症者各10人的血浆总皮质醇含量见下表,问这三组人的血浆总皮质醇含量有无差别?

三组人的血浆总皮质醇含量测定值(μg/L)

正常人 测定值 0.4 1.9 2.2

2.5 2.8 3.1 3.7 3.9 4.6 6.0 Ri ni

秩次 1 4 6 8 9 10.5 12 13 15 18 96.5 10

单纯性肥胖 测定值 0.6 1.2 2.0 2.4 3.1 4.1 5.0 5.9 7.4 13.6

秩次 2 3 5 7 10.5 14 16 17 19 24

皮质醇增多症 测定值 9.8 10.2 10.6 13.0 14.0 14.8 15.6 15.6 21.6 24.0

秩次 20 21 22 23 25 26 27 28 29 30 251 10

117.5 10

H0::三组人的血浆总皮质醇含量总体分布位置相同

第14页/共20页

研究生SPSS统计——秩和检验

H1:三组人的血浆总皮质醇含量总体分布位置不全相同 a=0.05

Ri212H3(N1) k1

N(N1)niSPSS 建立变量名

录入数值:

统计分析:

第15页/共20页

研究生SPSS统计——秩和检验

第16页/共20页

研究生SPSS统计——秩和检验

结果分析:

若g(组数)=3且最小样本例数大于5或g>3时,H或HC近似服从自由度为g-1的卡方分布。H=18.130,自由度=2, P<0.001,拒绝H0,三组总体分布位置不全相同,需做两两比较。

2.频数表法: 例5

(单向有序分类变量的多个样本比较)

用A、B、C三种药物治疗单纯性慢性支气管炎,结果见表第(1)~(5)栏, 问三种药物的总体疗效是否不同。

表 三种药物疗效比较的秩和检验计算过程

疗效

药物

秩次

平均 秩和R1

秩和R2

秩和R3

第17页/共20页

研究生SPSS统计——秩和检验

A B C 合计 (1) (2) (3) (4) (5) 治愈 显效 好转 无效 合计

17 51 33 7 108

5 11 52 24 92

3 17 47 26 93

25 79 132 57 293

(8)= 范围 秩次

(6) (7) (2) (7) 1~25 13.0 221.0 26~104 65.0 3315.0 105~236 170.5 5626.5 237~293 265.0 1855.0 —

11017.5

(9)= (10)=

(3) (7) (4) (7)

65.0 39.0 715.0 1105.0 8866.0 8013.5 6360.0 60.0 16006.0 16047.5

检验步骤如下: (1) 建立检验假设

H0: 三种药物疗效的总体分布相同

H1: 三种药物疗效的总体分布不同或不全相同

=0.05 (2) 编秩

用各疗效等级的合计值排序确定秩次范围,如表第(6)栏所示,A、B、C三种药物总的治愈人数是25,他们的秩次范围是1~25。同理疗效为“显效”组的秩次范围是26~104,以此类推。再对第(6)栏秩次范围的上下限求和取平均值得各等级的平均秩次,如第(7)栏所示,疗效为“治愈”组的平均秩1+25

次为2 =13。 (3) 求秩和

分别用第(2)~(4)栏各等级的频数与(7)栏平均秩次相乘再求和,如第(8)~(10)栏所示。 (4) 计算统计量H值

将第(8)~(10)栏的总秩和ΣT1、ΣT2、ΣT3代入公式(11.15)计算H值。若各样本相同秩次较多时(如超过25%),由公式(11.15)计算所得H值偏小,应按公式(11.16)和公式(11.17)对H值作校正计算Hc

12Ri2

H =N (N+1) (∑ n ) -3(N+1)

i

12(11017.5)2(16006.0)2(16047.5)2

H = 293 (293+1) ( 108 + 92 + 93 ) -3(293+1) = 48.23

C =1-(tj3-tj) / (N3-N)

第18页/共20页

研究生SPSS统计——秩和检验

C = 1- (253-25) (793-79) (1323-132) (573-57) /(2933-293) = 0.9086

Hc=H/C

Hc = 48.23/0.9086=53.08 (5) 确定P值和作出统计结论

若组数k=3, 每组例数均小于或等于5,可查附表H界值表,得出P值。本例各组例数均大于5,已超出附表的范围,则H值近似服从ν=k-1的χ2分布,可查附表的χ

2

界值表。故按ν=3-1=2,查χ

2

界值表得χ

2

0。05(2)=5.99,因为

53.08>5.99,故P<0.05。按α= 0.05水平拒绝H0,接受H1认为三种药物的疗效不同或不全相同。用SPSS统计软件中的nonparametric tests—K Independent Samples — Kruskal-Wallis H程序做秩和检验得到Hc统计量。

Ri212H3(N1)

N(N1)niHcHc

3C1(t3jtj)(NN)

k1

四、Friedman秩和检验

用于随机区组设计的非参数方法,分别在每个区组内编秩。

秩和检验方法要点和注意事项

检验方法

方法要点

注意事项

配对样本的1. 依差值大小编秩,再冠以差值编秩时若差值绝对值相同符号相

第19页/共20页

研究生SPSS统计——秩和检验

符号秩检验 的符号,任取T+、T-作为T,反,取平均秩次。0差值省略。 查附表9,T界值表。T>T界 值,P>α。 2. n>50,用z检验。

两样本1. 按两组数据由小到大统一编1. 编秩时若相同数据在不同组,的秩和检验(分布位置)

秩,以n1较小者为T,查附

取平均秩次。

表10 T界值表。T在界值范2. 当相同秩次较多时,使用校正围内,P>α。

2. n1>10或n1- n2>10时,用z检验。

公式。

成组设计多样1. 将k组数据由小到大统一编1. 编秩时若相同数据在不同组,本比较的秩和

秩,求各组秩和Ri。

取平均秩次。

检验(K-W检2. 计算H值,用ν=k-1查χ2界值2. 当相同秩次较多时,使用校正验)

表,确定P值。

3. 拒绝H0时,应作多个样本两两比较的秩和检验。

公式。

第20页/共20页

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- sceh.cn 版权所有 湘ICP备2023017654号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务