您好,欢迎来到尚车旅游网。
搜索
您的当前位置:首页医学统计学重点

医学统计学重点

来源:尚车旅游网
 .

1.变异:同质事物之间的差别。

2.频数分布的两个特征:集中位置,离散趋势

3.数据分布的类型:对称分布和非对称分布。非对称分布又称偏态分布,包括正偏态和负偏态。单峰分布,双峰分布,多峰分布。

4.统计描述:用统计表、统计图和统计指标等方法对资料的数量特征与分布规律进行描述。 5.集中位置的描述,集中位置指标又称平均数指标。有哪些及适用条件?

(1)算数平均数:最适用于单峰对称分布资料的平均水平的描述,特别是正态分布资料 (2)几何平均数:适用于①等比资料 ②对数正态分布资料

(3)中位数和百分位数:适用于①偏态分布的资料 ②开口资料 ③资料分布不明等 6.离散趋势的描述

(1)全距亦称极差,适用于单峰小样本资料 (2)四分位数间距,适用于单峰小样本资料

(3)方差和标准差,适用于对称分布尤其是正态分布资料

(4)变异系数,常用于①比较度量衡单位不同的两组或多种资料的变异度 ②比较均数相差悬殊的两组或多组资料的变异度

7.常用相对数(1)率,是二分类指标(2)构成比(3)比 8.正确应用相对数应注意几个问题: (1)计算相对数的分母不宜过小 (2)分析时不能以构成比代替率

(3)对观察单位数不等的几个率,不能直接相加求其总率

(4)计算率时要注意资料的同质性,对比分析时应注意资料的可比性 (5)也有抽样误差,需要假设检验。 9.率的标准法

(1)基本思想:采用统一的标准,以消除病情构成不同对治愈率比较的影响,使算得的标准化治愈率有可比性。

(2)目的:控制混杂因素对研究结果的影响。 10.正态分布 (1)概念P16

(2)标准正态分布,u变换:u= .

X,u是标准正态离差,μ是均数,σ是标准差。

.

u~N(0,1)

(3)正态分布的特征:

①是单峰分布,高峰位置在均数X=μ处。 ②以均数为中心,左右完全对称。

③取决于两个参数,均数μ和标准差σ。μ为位置参数,μ越大,则曲线沿横轴向右移动;μ越小,则曲线沿横轴向左移动。σ为形态参数,表示数据的离散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖”。

④有些指标不服从正态分布,但通过适当的变换后服从正态分布,如对数正态分布。 ⑤正态分布曲线下的面积是有规律的:总面积恒定为1,对称区域面积相等,对应区域面积相等。

(4)几个u界值:①90%:双侧②95%:双侧③99%:双侧11.二项分布

(1)样本率的标准差p的估计值

u0.1=单侧

u0.05=1.

uu0.05=单侧=单侧

uu0.025=1.96 =2.58

0.010.005s计算公式:ps=pp(1p),p是样本率 n(2)样本个数n和概率π如何影响二项分布的图形?

给定n后,形状取决于π。当π=0.5时,分布对称;当π<0.5时分布呈正偏态;当π>0.5时分布呈负偏态。随n的增大,分布逐渐逼近正态分布。如果nπ或n(1-π)大于5时,则可用正态近似原理处理二项分布的相关问题。 (3)应用条件:对立性,重复性,性。 12.Poisson分布

(1)概念,描述罕见事件发生次数的概率分布,是特殊的二项分布。 (2)均数与方差相等,均为λ。

(3)形状取决于λ的大小,为正偏态分布,λ越小分布越偏;随着λ的增大,分布逐渐趋于对称,当λ=20时,已基本接近对称分布;当λ≥50时,可按正态分布原理处理Poisson分布的有关问题。

(4)Poisson分布具有可加性。 .

.

(5)应用条件:对立性,重复性,性。即事件的发生是相互的,且发生的概率不变,结果是二分类的(发生或不发生) 13.参考值范围

(1)概念:绝大多数正常人某指标的波动范围。

(2)正态分布法计算100(1—α)% 正常值范围:双侧 X 单侧 X—

uS uS(高侧)

X+uS(低侧)

注意α取值:双侧95% X1.96S 单侧95% 高侧低侧>X+1.S

(3)百分位数法:知道求得第几个百分位数P26 14.抽样误差

(1)概念:由于个体变异的存在,由抽样引起的样本统计量与总体参数间的差异。 (2)产生的两个必备条件:①抽样研究 ②个体变异,是根本原因 (3)中心极限定理的涵义

①从均数为μ、标准差为σ的正态总体中、重复、随机抽取含量为n的样本,样本均数的分布仍为正态分布,其均数为μ,标准差为x。X~N(μ,x)→X~N(μ,x) ②即使从非正态总体(均数为μ、标准差为σ)中、重复、随机抽取含量为n的样本,只要样本含量足够大(如n≥50),样本均数也近似服从均数为μ,标准差为x的正态分布。 (4)标准误意义:1.用来衡量抽样误差的大小 2.x=

2标准误与个体变异σ成正比,与样本含量n的平方根成反比 n(5)标准误的估计值的计算公式:样本标准差s代替总体标准差σ,(6)标准差与标准误的关系 .

s=xs n .

区别 意义 用途 与n关系 标准差s 个体变异 正常值范围(x1.96s) n,s趋于稳定 标准误sx 统计量的抽样误差 总体均数的可信区间(x1.96n,sx) sx趋于 联系:①两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误;

②当样本量不足时,标准差大,标准误也大,均数的标准差与标准误成正比。

s=xs n15.医学统计学:运用概率论和数理统计等数学的原理和方法,研究医学领域中资料的搜集、整理、分析和推断的一门学科。

16.三类资料:①定量资料(数值资料)②定性资料(无序分类资料)③等级资料(有序分类资料)

17.总体:按研究目的所确定的研究对象中,所有观察单位某项指标取值的集合。 18.样本:从研究总体中,随机抽取具有代表性的部分观察单位某项指标取值的集合。 19.同质性:具有相同性质的事物。 20.参数:描述某总体特征的指标。 21.统计量:描述某样本特征的指标。

22.概率:随机事件发生可能性大小的一个度量,取值范围为0≤P≤1 23.小概率事件:发生概率≤0.05的事件。

24.小概率原理:小概率事件发生的可能性很小,进而认为其在一次抽样中不可能发生。 25.理解和解释可信区间

26.统计推断:根据样本所提供的信息,以一定的概率推断总体的性质。包括两方面的内容:参数估计和检验假设。

27.可信区间的两个要素:可靠性,精确性

28.均数的可信区间:从正态分布总体N(μ,)中随机抽取一个样本,则t=

2X-sx---服从自

由度ν=n-1的t分布。总体均数的(1-α)可信区间定义为(X— .

t,sx,X+

t,sx)。

.

如n>100,可用标准正态分布代替t分布,相应的100(1-α)%可信区间为(X—

usx,

X+usx)。

29.率的可信区间:

(1)率的标准差又称率的标准误,为

s=pp(1p) n(2)总体率π的区间估计用正态近似法的条件:样本含量n足够大,且样本率p和(1-p)都不太小时,如np和n(1-p)均大于5时,π的可信区间为(p—

usp,p+

usp)。

30.事件数的可信区间:当X≤50也可以查附表7“Poisson分布λ的可信区间”,得到λ的95%或99%可信区间。 31.假设检验 (1)基本思想: (2)4个基本步骤:

①建立检验假设:H0:1=2=3=……

H1:1、2、3……之间不等或不全相等。

②确定检验水准(拒绝H0时的最大允许误差α) ③计算检验统计量并求P值

④界定P值并作结论(要回下结论):P≤α,拒绝H0,接受H1;

P>α,不拒绝H0。

(3)Ⅰ型错误:H0真实时被拒绝。P>0.05却拒绝H0接受H1 (4)Ⅱ型错误:H0不真实时不拒绝。H1真实即P<0.05却不拒绝H0

(5)检验功效:Ⅱ型错误率β表示失去对真实的H1作出肯定结论之概率,故1-β就是对真实的H1作出肯定结论之概率,常被用来表达某假设检验方法的检验功效,即假设检验对真实的H1作出肯定结论之把握程度。 (6)Ⅰ型错误与Ⅱ型错误的关系P51 (7)单侧检验与双侧检验的关系 .

.

(8)假设检验与可信区间的关系 32.怎么做题?

判断资料类型→设计方法→计算自由度→确定P值→下结论 33.区分配对和成组

配对:同质性差,要算差值 ①自身配对 ②一般有编号

成组:①无原始数据(还有均数)②两组样本含量不等,不能配对 ③无编号 34.t检验

(1)应用条件:性,正态性,方差齐性 (2)两样本均数比较方差不齐时t’检验

(3)两样本几何均数比较:取对数,t检验,不用反对数 35.方差分析,多个均数比较 (1)总变异

SS总:

=

SS组间+

SS组内处理因素、个体差异、随机因素,共同导致的差异。

(2)组间变异(3)组内变异

SSSS组间:多个组的处理因素不同和随机误差,导致的差异。

组内:组内个体差异和其他随机因素,导致的差异。

(4)三种变异的关系:

SS=SS总组间+

SS组内,

=总

组间+

组内

FMS组间/MS组内

(5)单因素方差分析表和两因素方差分析表

36.多个样本均数的两两比较,对比的组数k大于2,分别t检验则需经过m=k(k-1)/2次比较,若每次比较的第一类错误率为α,则多次比较后,至少犯一次第一类错误的概率为1m(1-),比预先设计的α要大。

37.变量转换目的

38.F值、t值、q值、q’值之间的关系

(1)两样本均数比较时,F=t。用q检验或q'检验也得到同样的结论。说明在两样本均数比较时,t检验、F检验、q检验和q'检验是等价的。

(2)当组数k>2时,q'检验的检验功效高于q检验,所以当实验研究设计为一个对照组与多个实验组均数比较时,q'检验科得到较高的功效。 定性资料的分析 .

.

39.假设检验步骤P73 40.

2检验

(1)基本思想: (2)应用条件:

①n≥40,T≥5,用检验

②n≥40但1≤T<5,需用校正检验 ③T<1或n<40,改用确切概率法。 (3)理论频数T的计算公式:

22T=RCnRnC n(4)R×C表的自由度ν=(行数-1)(列数-1),故四格表ν=1 (5)要记的界值:

2220.05,1=3. 84

41.配对检验的应用条件:b、c为结果不同部分(甲阳乙阴、甲阴乙阳)

①b+c≥40时不用校正 2bc=

bc22ν=1

2②20≤b+c≤40时要校正 42.R×C表的应用条件:

b-c-1=

bcν=1

①多个率或构成比的比较,其自由度大于1

②R×C表中不宜有1以上格子的理论频数小于5,或不宜有一个理论频数小于1

3.对理论频数太小的样本的处理办法: ①增加样本例数

②删去理论频数太小的行或列

③将太小理论频数所在的行或列的实际频数,与性质相近的邻行或邻列的频数,合并。 44.参数检验:以特定的总体分布(如正态分布、二项分布)作为前提,对总体的参数进行的假设检验,条件:总体正态分布、总体方差齐性。

45.非参数检验:不依赖于总体的分布类型,不针对总体参数,只针对总体分布是否相同的检验方法;常用于解决总体分布未知的统计问题。 46.秩和检验 .

.

(1)基本思想:两组秩和相加等于N(N+1)/2。(n1+n2=N) (2)两组比较的秩和检验

①基本思想:若A、B两组等级分布相同,则含量为n1的样本之实际秩和T与其理论秩和n1(N+1)/2之差Tn1(N1)/2纯系抽样误差所致,因此差值不会很大,差值越大的概率越小。

②方法步骤:P88仔细弄明白

1°建立检验假设:H0:两组分布相同;

H1:两组分布不同。

α=0.05 2°编秩 3°求秩和T 4°确定检验统计量T

5°确定P值,作出推断性结论

(3)配对秩和检验:设n为非0差值的个数,则T+T=n(n+1)/2。 (4)秩和检验的使用范围:理论上可用于任意分布的资料 ①等级资料

②定量资料,开口资料

③定量资料,分布极度偏态,或个别数值偏离过大而不属于“过失误差”者 ④定量资料,各组离散程度相差悬殊,即使经变量变换,也难以达到方差齐性 ⑤定量资料,分布型尚未确知 ⑥兼有等级和定量性质的资料 (5)秩和检验的优缺点:P95 47.直线相关

(1)概念:用来描述两个呈正态分布的变量之间的线性共变关系。 (2)应用条件:双变量正态分布 48.相关系数

(1)概念:表达两变量间线性相关的程度和方向的一个统计指标。 .

.

(2)特征:①无量纲

②取值范围为-1≤r≤1。相关系数小于0为负相关;大于0为正相关;等于0为零相关 ③相关系数的绝对值越大,表示两变量间的相关程度越密切;相关系数越接近于0,表示相关越不密切。

(3)相关系数的假设检验用t检验

1-r2

sr为相关系数的标准误 sr=

n-2

r有公式 t=

rsr=r/

1-r2

n-2

①建立检验假设:H0:ρ=0,…与…无相关关系;

H1:ρ≠0,…与…有相关关系。

α=0.05

②计算检验统计量sr,r,t,ν=n-2

③作结论:按ν=8查t界值表得P<0.001。按α=0.05水准拒绝H0,接受H1。故可认为…与…之间有正相关关系。 50.何时用等级相关? 51.直线回归

(1)自变量x,应变量y

ˆ=a+bX (2)直线回归方程的一般表达式:Ya、b是决定回归直线的两个参数:a为回归直线在y轴上的截距;b为回归系数,即回归直线的斜率。

(3)b的意义:表示自变量增加一个单位时,应变量的平均改变量。要会解释,例如

3232b=0.2385(10cm/kg),表示体重增加1(kg),则体表面积平均递增0.2385(10cm)。

ˆ的意义:表示给定X时Y的平均值的估计。例如X=12(kg)时,Yˆ=5.3832(10(4)Y33cm2),其意义是:所有体重为12(kg)的3岁男童,估计其平均体表面积为5.3832(10cm2)。

.

.

ˆ的意义:称为剩余、残差,是y的观察值与对应的估计值之差。在回归图中表示(5)Y-Yˆ)各散点到回归直线的纵向距离。(YY=0

(6)

ˆYY2的意义:剩余平方和。坐标系中,每一条直线均可计算散点到该直线的

纵向距离之平方和;但只有各散点到回归直线的纵向距离之平方和,即最小的。以此为准则,可导出a、b的最小二乘估计(公式)。 52.回归系数的假设检验用t检验

ˆYY2是唯一

(1)sY•X为剩余标准差,常用于评价啊回归方程的拟合精度。扣除x的影响后,y本身的

变异程度。sY•X=

ˆ)(YYn22=

残差

自由度(2)sb为样本回归系数的标准误 sb=sY•X/

lXX

(3)①检验假设:H0:总体回归系数β=0,即…与…无回归关系;

H1:总体回归系数β≠0,即…与…有回归关系。

α=0.05。

②计算检验统计量:sY•X,sb,tb=

b-0sb,ν=n-2

③作结论:按ν=8查t界值表得P<0.001。按α=0.05水准拒绝H0,接受H1。故可认为…与…有回归关系。 (4)

t=trb,因为自由度相同,故回归系数是否为0的假设检验与相关系数是否为0的假

设检验是等价的。相关系数的假设检验更简单。 53.应变量总变异的分解

ˆY)YYˆ(YY)=(Y+

22剩2

SS=SS+SS总回剩 =n-1;

=+总

回剩;

总回=1;=n-2

.回归方程的方差分析 要会填表P125 .

.

t=trb=F,即在直线相关与回归分析中,相关系数的t检验、回归系数的t检验、回归方

程的方差分析是等价的。

55.直线回归与直线相关的区别及联系 (1)区别

①对资料的要求:回归只要求应变量y是随机变量且服从正态分布,变量x有两种:精确测量和严格控制的变量(Ⅰ型回归)、随机变量(Ⅱ型回归)。相关:x、y均为随机变量且服从双变量正态分布

②应用:回归反映两变量间的依存关系;相关反映两变量间的相互关系。 ③计量单位:r没有单位;b的单位是:y单位/x单位 (2)联系

①正负符号:在同一资料,r与b的正负符号相同。 ②假设检验:在同一资料,r与b的假设检验等价。 ③换算关系:P132

56.回归分析应用条件:线性、、正态、等方差 57.研究设计的三要素:研究因素、受试对象、实验效应

58.研究可分为2种性质:前瞻性和回顾性;又可分为两类:试验和调查。所以,研究设计的形式组合有4种。

59.试验研究与调查研究的区别: (1)研究条件 (2)观察对象 (3)例数

60.研究设计的基本原则:对照、随机、重复。 .

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- sceh.cn 版权所有 湘ICP备2023017654号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务