您好,欢迎来到尚车旅游网。
搜索
您的当前位置:首页SPSS数据分析—混合线性模型

SPSS数据分析—混合线性模型

来源:尚车旅游网
之前介绍过的基于线性模型的方差分析,虽然扩展了方差分析的领域,但是 并没有突破方差分析三个原有的假设条件, 即正态性、方差齐性和独立性,这其 中独立性要求较严格,我们知道方差分析的基本思想其实就是细分, 将所有对因 变量产生影响的因素逐一摘出,但是如果各观测值之间相互影响, 这样在细分影 响因素的时候,是很难分出到底是自变量的影响还是观测值之间自己的影响。 虽 然随机抽样会最大程度的使数据满足独立性, 但是有时候这种方法并不奏效,比 如随机抽取受访者分析其消费特征,这里就假定所有受访者的之间是相互独立的, 然而仔细想想,这其中存在问题,如果某些受访者来自同一个城市或地区, 从个 体角度讲,他们确实是独立的人,之间没有任何联系,但是如果从分析目的角度 讲,由于区域因素他们之间的消费特征是趋于相似的, 而产生这种相似性,正是 由于相互作用导致,这些人是存在相互影响关系的,也就类以于相关样本,与此 同时,这种相互作用也使得不同城市间的消费特征产生差异,我们称这种数据为 具有层次聚集性的数据。数据的聚集性除了表现在聚集因素间指标的均值水平不 同外,还表现在不同城市间的指标离散度上。

从层次聚集性数据也可以看出,随机抽样只能保证数据被抽到的概率相同, 但是 对于抽到的是什么样的数据,却无法控制了。对于这种具有层次结构的数据,如 果分析目的仅限于这几种层次,比如就分析这几个城市,那么可以把它当做一种 固定因子,只分析固定效应而不用考虑这种聚集性, 但是如果想把结果推广到所 有城市,那就不能忽略这种特征,否则会降低结果的准确性,因此还要加入随机 效应。

混合线性模型就是同时包含固定效应和随机效应的线性模型, 是解决此类层次聚 集性数据的方法之一,对于具有层次结构的数据,我们需要将使观测值之间产生 相互影响的层次因素也摘出来,比如上述中的城市因素,传统的方差分析模型中, 将所有无法解释的因素都归在随机误差中,而随着我们对传统方差模型的不断拓 展,对随机误差的分解也越来越精细,结果也越来越准确。

【例】我们想分析哪些因素会对16岁时毕业成绩的影响,显然毕业成绩和学校 有关,好学校的学生成绩会好一些,而差学校的学生成绩会差一些,那么学校这 个因素就是上述的层次因素,它使得因变量产生相关性,而且我们是想把结果推 广到所有学校,因此学校这个变量应该被定为随机变量, 我们首先按照一般线性 模型来分析,不考虑层次因素 分析一一般线性模型一单变量

因变量为1気岁成绩* 协变量为口岁成集' I®机因子为学檢,不 做其也设定,不考虑 二者

交互作用F直犊 分析其主敷应

在按照一般线性模型分析之后,我们再来看看按照混合线性模型分析的结果会有 什么不同

i-r.-.r

16< i; *

|| F 囂5?1 1 4«1 丽 2WW 口删 古怡mdln 1127 120 1 1127J3O 1S92.5SC .04Q ■X?& 225S 709 3射3 閒P SChQDl rrii 173104 64 10 303 .0C0 225ft 704 3$»3 5#«1 2 $86 MSf^liaaQ « 414 M^C:1 J

b唄卅乃

只看方差分析结果, 11

岁成绩稲学校对因 娈重均有显著凳响, 我们将该结黑与后续 用混合线性模型分折 的结果作对比

分析一混合模型一线性

首先弾出的对话框 用耒设置作为层欢 因素的娈量「特其 设墨在主赢对话框 中,本例为学校A 如黑不设董的话J 后面的分折则认为 没有层次因素❺

谡罟好层次因素之 后,进入的親合线性 模型的主对话框'和 -殿尊性模型类似, 住此可叹对模型做更 详细的设臥本例 中,我们首先来分析 学技这个因素是否是 层次因素,也就是检 齡不同学棣的平均成 绩罡否有差异,因此 不纳入任何其她因 子』只选入因变量 在睛机对话框中,我 们选走包含截距,并 将学校选入组合中『 如果学梭不是层次聖 集因素的话'那么所 有学校的平均成绩应 该相同》体观在图中 就罡所有回归线的初 姑点即载距相等“如 果不相等『说明其中 有变异.那么变异的 耒源就是最开始设走 的学校因素。

I --------------------------------------------- 匚幅濒计働 |匕啊tfog云g ] ] 统计量按钮,可咲 选擇要输出的一些 绕计量和检验值, 在此找们选择举数 估计和协方差参数 检验P其中协方差 聲数检蝮就是用来 检验层次聚集因素 的 I r**8®** ------------------------------------ 1 j荃靖店计p 丿怙育運费鉄检題® □ WISiimXtttEi 壘對活计怕団方整直i 馬世笳是的间方菱迴. •洒协万雀世) I □时比矗禮距降Q 1 1 t 1 1 3 a J ■■

16: ■', *

2 t. -1 ■ - ■ t 11.5 RANDOM -I-I / I :…

S* IS的命&常洋可II产堂不岡于先初版本的诘 M< 11诵洁•阖当耐 afr^iHiunrwM^wft ・

结果中首先输出的是模型

维敎•也机是復型的情况 撕要・由于我们浚有纳入 任何因子,因社墻要很胃 单,只有默认输乱的固定 效应的靈曜,和之蔚手动 设蓋的瞳机效应敲还 有疾差。建意这里臣机裁 囱蔬距的林方差踣构类型 为默认的方差«»-也可 以在施机対话框中更改设 5

偿毘条F肾 -2受旳束的对政戦?MS Akalke的信息魚件(Al® Hurvi^h和丁囂汕的条评 (AICC) Bazdogan 的棗件(CA1C) Schwarz :Ei Bayesian ■' (1 (BIC) 1 101J.624 11016.624 11016,627 接下来输出的罡信 息条件『也就是一 些信息准则.用来 判斷模型中引入的 因素是否有统计学 意义

11033.241 11031 2+1 ■信理同世):I笳 [g» ] 卫兀]* 覆少为驳甲的格式显示信愿采髀・

定效应

裁下来辅出同走效应模 型・竄假

设为所有字校的 咸祭均值为U\"由于爱有 纳入任何因子,因此 P=0. 807>0.05> 是不能 柜絕幕假设的

:區 [母S 1 62.529 F .060 .807 协方卿當数

■■因变呈;戚謝

wjuzirwiAiF 亦•. tdTKM !■ ■ uni 厂塀® 011573 11WVF B47T51 ;障=scfMjaq * 工 inm aia^n 93非押 41 687 OOQ QOQ 冊T创 HfHi 陆爲输出的检方差靈魏琴架・鱸是对陆W.部分的分析裁果,也殖是对 学校是杏是层次鑒集囲麦的最缪定论。此处,原假设为I®机麹应的方 差为m也強是不存在賈异。等冃于不冋学枝见的威待均值設有差 身,可见计值萍不為0・检监給果也是柜寰捺假设,因吐 可以判断,学校确寞星一个匡真衆集因憲*

上方的匪望走示越个腕测值\"也或是学生之冏是香存在个体差异\"也 是拒绝康鶴诰,即认均学生之目是存在个律差异的

经过以上分析,我们知道学校确实是一个层次聚集因素, 不能按照一般线性模型 进行分析,那么影响16岁考试成绩的原因有很多,我们继续加入变量进行分析。 首先加入11岁时的入学成绩,先将其加入固定因素,并观测和之前不加人任何 因子相比有何变化

'• ' *E\"■占 • W2W fliFlWWV---

将口岁入学成填纳入,由于是连续娈量“因此进 入协变童,并且在固走按钮中'将其迭入模型

倩暑乖作'

f -r - v sliandlrt ■ i i Mffll-K I 1 1 冷卸fit if S3E8.735 豈旳柬的对数似甦苗 9372735 9372 738 930^351 9365351 脚Z. 1 school Akaike的柑息秦件(*© HurvicH Tsai 拘玉件 (AICC) Bozdogan 寂&丨(CAIC) Schwarz 的 Bayesian 丢件 (BIC) ail n*诙吊-

1 4 i :1 . 4 T( -,- k'\"L

b \\ 1U ”

庄町武厂豎事剧予 UWlfllK 细啟草心忆隱忌索農柿 谄 L - 上峙站HU』椚甲¥竹屮

以墩少为披好\"的檔式显示佶息臺件・

首先模型槪况中固定效应多了新如入的变量,其次各个信息 条#的值,也比之前降低,说明有韶分娈异襪隸加入的变量 所解释*

固定效应

E3忖績轨曲曲特空惋

挪 ■-曲 i酊 F 0QJ 2041 M| 1

sian-ain □ ■; . ,- T6'-.'.气

90732 4050074 1 — _9$4 000 棲下来的固走效应分 折中,可看到 F<0-05,说明新扣入 的变量确实对因娈量 产生軫响,并目怙计 值为正埶,说明呈正 相关髡响\"即入学成 饋陋高,毕业成绩也 14高。

曲案隨底『◎广 (It-ifpJ 9£% ■ l*ii; W1! ttandlft 1住厲r dr t WXh !辺 1 ■ QflMIO 567746 O&331S 5t33D5 040354 012160 «D.732 4050.074 057 45190 m輔at .000

4 : F t 曲 2 F

协方號毬口怙计\" 95% R J || g熬g補 WsldZ 44 672 4 343 OOD QOQ SBfiflg; J1W? 018SB6 .541571 QG3119 .591 241

-■.ir] = whcofl 093卿 U9503 H;时我们再来看龍机部分的分折结果,甘计值比恿来小整參,说明之 前祯归在随机效应巾的銮异被新加入固定效应巾的克望所《8釋棹了, 也iftfflilfittA的变堕便得

原敷狐的层次累集性璋诙

通过以上分析,我们看到,在固定因素中加入入学成绩这个变量以后, 对于层次 聚集性起到了减弱的效果,但是该影响仍然存在,说明还需要引入其他变量以完

善模型,之前讲过,数据聚集性除了表现在聚集因素间指标的均值水平不同外, 还

表现在不同聚集因素间的指标离散度上,我们现在将 变量加入随机因素中。

11岁时的入学成绩这个

点随机按钮.将娈量 纳

入模型

< 2肉束囱对数似兰朋 Atalke (AIC) Hunrich ft I Tsai .i'i 1 (A!CC) Bczdogan 的貞fl (CAIC) 9335.677 9341 677 B341 683 9363.602 信息条井值进一步 降低』说明将该娈 量引入至随机效应 中罡有敦果餌

Schwarz -I'--.! Bayesian 93C0.602 W: CBiC) mt-八訓小:你川厂二山讯亡XI

3固亜宣:鶴岁威酚・

伯息条ft戶

■2哽旬索的时数®l聲值 Akalk9335.677 金的信息睾件別® Hundch ftl 9341 677 Tsai I'I 1 (AJCC) Bozdogan 的負fl (CAIC) 8341 683 Scliwarz ■!'■■] Eiay^s ian 9363.602 论戸 CBIO 93C0.602 信息条件倩进一步 KfS.说明齬该蜚 量引入至随机效应 中罡有敦果的

;fi .t: XI

a固变2: 16罗威绩-

df - 1 a 60 136 ' 3S.9M F D*t mw Sil OM | a. Jf ■・16亨1$上 | e 固走效应结果浸有太 犬变化,检验翳果也 相同

IM半 i&n: - S-57021 mndin .M0M4 dr M4M 1 u v严— Mi .oao 用 4FM79 ..沁 27 n j sum

协方差挣数

9$% *fJ-.-: nJ siz Its tv | !■ 魅甘 WaldZ I勿 Q00 J000 oeiS35 553636 Q1219? 44 31* 490C 3.U7 57S€5& ■ 、■' 1 !■ 5 ICtkOOl] \\ 如\"lit【

0»1»4» .tM 4749 137174 (^64640 上tn 8. I'; |祐冷比厲

随机效应检馥中,可臥看岀斯加入的娈童屋有境计学意又 的*说明11岁入学旗绩度対诃岁是存在彩响的』并且残差和 粲集性因素的方差也进一步降低,说明该变量的引入罡有效 果的&

在将11岁毕业成绩引入到随机效应之后,层次聚集性又进一步减弱了,实际上 我们可以不断的引入变量,这样最终层次聚集性就会消失,下面我们再来引入性 别、学校类型、各学校学生在11岁入学时的平均成这三个变量。

由于性别和学校类型属 于分类变量,囲此迭入 因子选框、而学校平均 成绩是连续变量'蛊要 选入协变量选框

停3!哪肝'

.-*2 广 l.=Fr ■a- § 阖〒二 嘗柜 1 1 gMdar 3 1 3 2 配汕<fkt 1 1 avsin 1 1 r鳖曲吕 約” HQ r^*^andlrth 2 2 school 氓曼 1 BiV W 卑 ・.也履■:情:r■产

3 b,干较丰11 5 ' RAMDOM ?■•酩險的常建風莊已*.卩旷斷节:工叫嵐 广

业平“千先耐钿塔屡 TflXTFTF|T用號宅11 1-f*-咐崔闵出?

r it si 由于我们认为学校 是层次聚集性因 素,因此新加入的 变量都选入固定效 应中,輸岀的模型 摘裳结果如左图

if聶轻件’

-2 StVS的对数认然ffi Akalke的信盘兼怦(AIG) Huwich^oTsai 力记件 (AICC) Bozdog^n 的嶷件 CCAIQ Schwas0i Bayesiin 兼件 (SIC) 9305.974 9311.974 9311.990 9323636 933Q896 11息粲件值

进滾隔 惟.说明引 入变量起到 作用,实际 上我们可以 逐步引入喪 量进行比按

独■戟心占号術■的溶式畀〒信目棊件

a因雲量:1蜩成始

玄距— gender schgend stan dirt avelrt 固定效应旳脸瞬烫型|卜 行干曲 分母(if F 址昔性 1 1 56956 4032716 61.942 57.164 61 156 24.5S7 2 573 726.9S6 11 579 .499 QQQ .094 .aoo .G01 2 1 1 嚴后输岀的效应类型橙 验中.新引入的变量 中,学枝类型是没用窥 计学直义的

a.E .畳.

固足承应-启汁目 95%匿直 4& KJB [gsndei^O] hendei^l] 由计 df .063753 54.369 t 2.260 .027 F隕 .017575 IFF A 45373 .273171 -.157903 Q b.033855 0 4032.716 -1.959 -1 Jfi9 .3^9 - 26.963 3.403 □DC ■ 234278 -.101529 1 e [schg«nd=1] -.144522 [schg@nd=7l .042609 [«chgond=3] standlrt avslrt 0b .548445 .363210 □01750 ,1 16224 C 60413 68.042 - 57.164 61 156 092 713 -.309023 -.189030 □18990 274BO0 - □20341 .1O674C ODO 0D1 .507716 .149770 .589175 576650 a.目冬量比◎'壺沾

b・因為此番数冗命 ' 所门特苴询严霁

可以看到,虽然没有直 接隹眩机效应中引入变 量.但是固定效应中引 入的变最使得聚築圍素 所芳差

进一步说 明引入的变量是有橈方整•巾牯11*

作用 的。

:va 卜命 阳Id 2 a int r^[' 4 = Kh&继续将变量引入随机效应、或者分析变量间的交互作用 等,对数据进行更进一步的分析。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- sceh.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务