第35卷第5期 江西师范大学学报(自然科学版) Vl0l_35NO.5 2011年9月 JOURNAL OF JIANGXI NORMAL UNIVERSITY(NATURAL SCIENCE) Sep.2011 文章编号:1000.5862(201 1)05.0548.03 计算机化自适应诊断测验新的选题策略 余 丹,潘奕娆,丁树良 ,杨 (江西师范大学计算机信息工程学院,江西南昌330022) 摘要:提出了一种既能满足属性平衡又能有效处理相似属性模式的新方法——改进的极大化整体判别认知 诊断模型信息量指标法(MGCDI).对无结构型的属性,讨论定长CD.CAT的选题策略.研究结果表明,使用 相同选题策略选题时,先选择可达矩阵的所有列对应的项目比不使用这些项目的诊断准确率高. 关键词:计算机化自适应诊断测验;选题策略;可达矩阵;诊断准确率 中图分类号:TP 18 文献标识码:A 的总和为 0 引言 GDlj(dti)= 传统的基于项目反应理论的计算机化自适应测验 (computerized adaptive testing based on item response 强。g( I. theory,IRT.CAT)只从宏观上为被试提供一个测验 虽然GDI方法能够有效地揭示被试认知剖面图 分数,并不从微观上分析被试内在的知识结构及认 (profiles),但是没有考虑属性覆盖.平衡属性覆盖 知技能….计算机化自适应诊断测验(computerized 类似于IRT-CAT中的内容平衡,但是IRT-CAT中大 adaptive testing with cognitive diagnosis.CD-CAT)不 部分内容平衡方法无法直接应用于CD.CAT.因为, 仅为被试提供一个测验分数,而且能够提供详细的 在IRT-CAT中模型通常需要的内容区域是互斥的. 诊断信息,即被试掌握了哪些属性(正确作答一个项 换句话说,如果一个项目属于一个内容区域,那它 目需要的任务、子任务、认知加工或技能),未掌握 就不属于另一个内容区域.但在CD.CAT中,一个 哪些属性,还需要在哪些方面进行补救I2】.CD.CAT 项目可以同时测量多个属性. 正如IRT—CAT一样,其关键也是选题策略.本文在 修正的极大化判别指标法(modiifed maximum 属性满足无结构型的条件下,讨论定长CD.CAT的 global discrimination index method,MMGDI)中的指 3种选题策略,并讨论题库是否含可达矩阵对这3种 标是通过将属性平衡指标与整体判别指标(G伽相 选题策略诊断准确率的影响. 乘,即可获得修正GDI指标(MGDI),其具体计算公 式为 1 CD.CAT选题策略 MGDIj(&f)=兀(( 一bk)lBk)qpGDlj( ̄ti), 1.1 MMGDI方法 尽管Kullback.Leibler(KL)信息量在统计上可以 其中兀(( 一 )/ )%为属性平衡指标,Bk为测量 有效地区分被试估计的知识状态与真实的知识状态, 属性k需要的最小项目数,即最少需要 个项目测 但在实际操作中,被试真实的知识状态是未知的. 量属性k,bk表示测量属性k已选择的项目数. 当属性个数为K时,被试真实的知识状态最多有2 1.2 CDI方法 种可能.因此,Xu xueli等【3]提出整体判别指标 如果一个测验可以有效地区分2个相似的属性 (global discrimination index,GDI),GDI为 ( ,1 def) 模式,那它一定可以很好区分彼此不相似的属性模 与所有其他模式条件下 条件分布之间KL信息量 式.认知诊断模型(CDM)信息量指标法『4 (CDM 收稿日期:2011.06—09 基金项目:国家自然科学基金(30860084,60263005,31160203,31100756)资助项目. 作者简介:丁树良(1949.),男,江西樟树人,教授,博士生导师,主要从事计算机辅助教学、应用统计及教育和心理测量方面的研究 第5期 余丹,等:计算机化自适应诊断测验新的选题策略 549 information index,CDI)的主要思路是在比较2个相 似的属性模式时赋予更大的权重.通常情况下,比 较任意2个属性模式 与 之间相似度的指标是欧式 距离的平方 ^r+1种.每种属性掌握模式产生30名被试,则模拟 被试人数为(63+I) ̄30=I 920. 2.2题库的生成 (1)含可达矩阵的题库 无结构型的 阵共有 h(a, )=∑( 一 ) . 当h(5, )的值越小说明这2个属性模式越相似, 6列, 阵共有63列,题库中题型含8个可达阵,4个 Qr-R( ̄[I将 中减去R对应的列),即8×6+4×(63— 6)=276,每一类题型放5个具体的项目,则模拟的题 一 ● 应赋予更大的权重.CDI中使用h(a, )的倒数,认 库中所包含的项目总数为276x5=1 380. n 知诊断指标CDI 使用加权平均数,作为第,个项目 区分属性模式能力的评价指标,其具体计算公式为 南荟 5v 1.3 MGCDI方法 MMGDI方法可以有效地解决属性平衡问题, 而CDI方法能够很好地处理相似的属性模式,本文 考虑将这2种选题策略相结合,提出MGDI+CDI(简 写为MGCDI)的混合指标法[5】. 在MMGDI方法中,MGDI指标计算公式中的 q肪是非0即1的元素,注意到(( 一 )/ )<l,故 (( 一 )/ ) >(( 一 )/ I.从而会出现相对于 满足约束条件k的项目,不满足约束条件k的项目更 易被选择【6】.因此提出的新选题策略MGCDI考虑对 属性平衡指标进行修改,以确保q腑=1时括号内的 值大于q聃=0时的值,其具体计算公式为 MGCDIj: ∑ ( , ) c=l 2 Eh( ̄ti,5c)一 KLj( f 1 ) c=l 2 模拟研究 2.1被试的生成 本文使用6个属性,考虑属性无层级关系,即无 结构型,如图1所示. 田田田田田田 图1无结构型 无结构型的邻接矩阵为零矩阵及可达矩阵 为 6阶单位阵,由扩张算法 ¨ 得到6行63列的缩减关 联矩阵Q ,即除零列外其他所有的6行1列的0-l 向量.由 阵可知,若 阵有Ⅳ列,加上全为0 的列(它表示一个属性都未掌握),则被试的种类为 (2)不含可达矩阵的题库直接从Q卜屁中随机 抽取,直到与含可达矩阵的题库容量相同为止.一 由于无结构型中各个属性是相互的,故测 量每个属性需要的最小项目总数均设定为4. + 2.3测验的构建 n=、 本文采用DINA模型,使用2种方式生成项目 参数,一种是失误( )参数和猜测 )参数,均为定值 且s=0.10、g=0.15,主要是消除项目参数对诊断准确 率的影nli;另一种是失误( )和猜测 )参数均服从均 匀分布u(o.05,0.25). 本文采用定长测验,测验长度设为30.(1)当 = 0.10,g=0.15时,分别进行以下2个实验:①不含可 达矩阵的题库,按MGCDI、MMGDI和CDI值最大 选题;②前6个测验项目对应可达矩阵的所有列,后 面的项目按MGCDI、MMGDI和CDI值最大选题.(2) 当S和g都服从均匀分布u(o.05,0.25)时,分别进行 如上①、②实验.本文采用最大似然估计(MLE)方法 估计被试的知识状态. 2.4模拟得分阵 根据DINA模型的反应函数、被试模拟的真实 知识状态、项目参数真值(失误参数S和猜测参数 和测验项目模拟得分阵:被试i对项目.,的得分概率 P,(口 再产生一个随机数 服从(0,1)上的均匀分 布,若 <P/(5i),则被试i在项目J上得1分,否则 得0分. 2.5评价指标 为了评价测验的诊断准确率,采用以下2个评价 指标:假设CD.CAT共有 个属性且有JV个被试参 加测验, 是第i个被试的真实知识状态,而 是通 过CD。CAT最终估计出的被试属性模式. (1)模式判准率(pattern match ratio,PMR)如果 与 的各个分量都相同,记为hi=l,否则记为 Ⅳ =o,则模式判准率PMR= /N. i=1 (2)边际判准率(marginal match rate,MMR)分 为单个属性判准率和边际判准率2种.若判准了被 试i的第k个属性,记为g =1,否则记为g沂=0.令 55O 江西师范大学学报(自然科学版) 2011拄 N N ( )=∑g /N,MMR=∑MMR(k)/K,分别 况;只讨论K=6的情形,而没有讨论其他的情形. i=1 i=1 由于CD.CAT初始阶段选择可达矩阵对应的项目必 称MMR(k)、MMR为属性k的边际判准率、平均边 然面对这些项目曝光率高的问题,因此,控制项目 际判准率即为边际判准率. 曝光率不均匀是另外一个值得讨论的问题. 3结果及其分析 5 参考文献 每种选题策略均重复20次实验,实验结果如表 【1]Gierl M J.Making diagnostic inferences about cognitive attrib- 1所示. utes using the rule-space model and attribute hierarchy me ̄od[J1. 表1 不同选题策略下诊断准确率 Journal ofEducational Measurement,2007,44(4):325—340. [2]Chang Ying.Improving cognitive diagnostic computerized adap— tive testing by balancing attribute coverage:the modiifed maxi— mum global discrimination index method【j].Educational and Psychological Measurement,2010,7O(6):902—913. 【3】Xu xueli,Chang huahua,Jeff Douglas.A simulation study on compare CAT strategies for cognitive diagnosis【EB/OL]. [201 1-04—12].httrl://www.psych.umn.edu/psylabs/catcentral/t)dWo 20files/xu03—01.pdf. 【4]Henson R,Douglas J.Test Construction for cognitive diagnosis [J】.Applied Psychological Measurement,2005,29:262—277. 【5]潘奕娆.改进的最大优先指标及在计算机化自适应诊断测验 中的应用[D].南昌:江西师范大学,2011. [6潘奕娆,丁树良,尚志勇.改进的最大优先指标方法[6]J1.江 西师范大学学报:自然科学版,201l,35(2):213.215. [7]杨淑群,蔡声镇,丁树良,等.简化Q矩阵的扩张算法【J].兰 从以上表中可以看出,在相同测验条件下,新的 州大学学报:自然科学版,2008,44(3):87—91. 方法MGCDI的诊断准确率均高于MMGDI和CDI方 [8]丁树良,杨淑群,汪文义.可达矩阵在认知诊断测验编制中的 重要作用[J】_江西师范大学学报:自然科学版,2010,34(5): 法,而对于同一种选题策略使用可达矩阵对应的项目 490—494. 的诊断准确率均高于不使用可达矩阵对应的项目. [9]Shigemasu K,Okada A,Imaizumi et a1.New ̄ends in psy— chometrics[C].To1(yo:Universal Academy,2008. 4 讨论 [1O]吴智辉,甘登文,丁树良.可达阵列在认知诊断选题策略中的 运用[JlJ.江西师范大学学报:自然科学版,201l,35(4): 422—426. 本文只讨论了选题策略在无结构型下诊断准确 【11】丁树良,汪文义,杨淑群.认知诊断测验蓝图的设计lJ1.心 率的优劣,并没有讨论在其他属性层级结构下的情 理科学,2011,34(2):258—265. A New Item Selection Strategy of Computerized Adaptive Testing with Cognitive Diagnosis YU Dan,PAN Yi—rao,DING Shu—liang ,YANG Qing.hong (College of Computer Information Engineering,Jiangxi Normal University,Nanchang Jiangxi 330022,China) Abstract:This study puts forward a new method named MGCDI.which combines modified MMGD1 with CDI.It can both meet balancing attribute coverage and deal with similar attribute patterns effectively.This study attempts to construct a new item selection strategy of CD—CAT with fixed length under the unstructured hierarchy.And Monte Carlo simulation iS implemented to compare the diagnostic accuracy of three item selection strategies in the bank with or without including the reachability matrix.Simulation results indicated that the new way selects the items from the reachability matrix as starting point.and then other items from the bank including the reachability matrix with maximizing MGCDI.MMGDI or CDI,the diagnostic accuracy of which iS higher than selecting all items from the bank without including the reachability matrix with maximizing MGCDI.MMGDI or CDI.In future study.how to control the non.uniform exposure is WOrth consider.It will be an interesting topic. Kev words:CD.CAT;item selection strategy;reachability matrix;diagnostic accuracy (责任编辑:冉小晓)