2010年9月 吕梁教育学院学报 Journal of L.vliang Education Institute Spet.2010 第27卷第3期(总第73期) Vo1.27 No.3(Sum.No.73) 【教学改革】 Apriori关联算法在学生教学能力分析中的应用 王兆连 (吕梁教育学院,山西吕梁033000) 摘要:数据挖掘作为一种新兴的数据处理技术,在社会各领域得到了广泛应用。本文提出 将数据挖掘技术应用于高师类学生教育教学能力的分析中。并以我校部分学生数据为对象,运用 数据挖掘的重要模式Apriori关联规则进行数据挖掘。发现了影响学生教育教学能力的主要因素 及相互关系,为高师类学校学生教育教学能力培养提供了决策依据。 关键词:数据挖掘;Apriori算法;教育教学能力 中图分类号:G633.67 文献标识码:A 文章编号:1672~2086(2010)03—0104—02 绩。这些信息通过学院各教学系获得。数据以EXCEL格式 存储。 2.学生个人信息调查表:这部分数据是从各教学系保存 的学生个人信息调查表中抽取的。主要有包括以下一一些内 容:性别、年龄、籍贯、家庭出身、是否独生子女、性格类型、月 数据挖掘技术是近几年发展起来的新兴技术,它在挖掘 大量数据中隐藏的模式和知识方面是其他技术方法所不能 比拟的。目前被广泛应用于商业领域的数据挖掘技术也被 广泛应用于其他领域。在高校人才培养的过程中,该技术的 应用也逐渐展开。教育教学能力作为高校师范类学生一项 很重要的能力,如何利用数据挖掘技术发现其培养方法和模 式也显得尤为重要。本文试着将Apriori关联规则基本原理 平均消费水平、是否曾任主要班干部、有无参加社会实践活 动、对专业课的兴趣、课堂学习效果、课外阅读时间等。 (二)数据集成 应用于高校学生教育教学能力的分析培养中。 一、高师类学生教育教学能力分析数据准备 在此分析中,数据源学生成绩表中抽取学号、课程平均 成绩、实习成绩(教育教学能力)等信息。学生个人信息调查 表只抽取区分度较大的属性:性格类型、有无参加社会实践 活动、是否曾任主要班干部等。最后得出学生教育教学能力 分析基本数据表如下表1 (一)数据来源 本文数据来源于吕梁教育学院2008和2009届共705名 学生两方面的数据: 1.学生成绩表:包括学号、姓名、课程平均成绩、实习成 表1 学生教育教学能力分析基本数据表 学号 200501 1201 2005020925 课程平均成绩 82 68 性格类型 外向 由 有无参加社会实践活动 是否曾任主要班干部 无 无 实习成绩 优 差 是 否 2o05021024 2666031514 74 69 外向 由 有 无 否 无 良 由 (三)数据转换 教育教学能力的“优”和“良”合并为一个区间“优良”,“中” 和“差”合为一个区间“中”。另外,将其他属性进行代码转 换,代码转化表如下表2: 表1中的课程平均成绩是数值型属性,根据成绩本身的 分布特点,它将离散为三个区间:大于75分为优良,间于65 和75之间包括75为中等,小于等于65分为较差。同时将 收稿日期:2010—06—22 作者简介:王兆连(1973一),女,山西临县人,吕梁教育学院讲师。 104 表2教育教学能力分析代码表 属性 值 代码 性格类型 外向 10 内向 11 中 12 是否曾任主要班干部 是 20 否 2l 有无参加社会实践活动 有 30 无 31 课程平均成绩 >75(优良) 40 65—75(中等) 4l ≤65(较差) 42 教育教学能力 优良 50 中 51 例如有下列记录如表3: 表3代码转换实例表 性格类型 是否曾任主要班干部 有无参加社会实践活动 课程平均成绩 教育教学能力 外向 是 无 76 优良 根据代码表进行转换如下: 确定该步的最大项集。对教育教学能力数据进行转换后的 {10,20,31,41,50} 事务集数据应用Apfiofi算法生成的最大频繁项集为{(10, 二、应用Apfiofi关联规则算法对学生教育教学能力进行 21),(21,40),(31,40),(10,20,30),(10,30,50),(20,30, 分析 50),(21,41,51),(30,40,50),(31,41,51),(12,21,31), 师范类大学生教育教学能力样本数据表共有75条记 (12,21,51),(12,3l,51),(2l,31,51),(12,41,51)}。 录,设定最小支持度为20%。 (二)生成关联规则 (一)生成最大项目集 根据最大频繁项目集,生成关联规则(设minconfidence 对教育教学能力数据进行转换后的事务集数据跟踪 =70%)共挖掘与教育教学能力相关的规则11条,如下表4: Apfiofi算法,创建每步的候选集(设定minsuppo ̄=20%),并 表4关联规则与支持度 规则 支持度(s%) 置信度(c%) 规则 支持度(s%) 置信度(c%) 10.30=>50 24 86 12.21=>51 24 75 20.30=>50 24 83 21.31=>51 32 78 21.41=>51 24 83 3l=>51 40 77 30.40=>50 20 87 12.41=>5l 20 83 31.41=>51 21 91 40=>50 31 72 12.31=>51 25 78 三、关联规则结果分析评价 4O=>50 suppo ̄:31%confidence:72% 对以上1 1条规则进行分析评价如下: 31=>51 suppo ̄:40%confidence:77% 1.学生性格特征、是否曾任主要班干部、是否参加过社会 通过代码转换,表明:第一,参加过社会实践活动的同学 实践活动、课程平均成绩是否优良都在不同程度地影响着学 有86%的具有较强的教育教学能力;第二,曾任过主要班干 生的教育教学能力。性格比较外向、曾任过主要班干部、参加 部并参加过社会实践活动的同学有83%的具有较强的教育 过社会实践活动、课程平均成绩也优良的同学100%的有很强 教学能力;第三,参加过社会实践活动,课程成绩优良的同学 的教育教学能力,这部分学生也是学校的佼佼者,各中小学校 87%的具有较强的教育教学能力;第四,课程平均成绩优良 用人单位倍加欢迎的人才。但是学校本身培养这样的同学的 的同学72%的可能有较强的教育教学能力;第五,没有参加 难度非常大。在此数据样本中,这样的同学仅占总数的3%。 过社会实践活动的同学有77%教育教学能力较差,这样的同 2.单一的性格比较开朗、担任过主要班干部、参加过社 学占总人数的40%,应当引起学校的高度重视。 会实践活动、课程平均成绩优良的同学,教育教学能力较强 可见,社会实践活动、课程成绩是相对重要的两个组合 的可能性非常小。在此数据样本中单一课程成绩优良、教育 因素。也就是说,师范类高校在培养学生教育教学能力过程 教学能力较强的同学只占到总数的5%,而单一参加过社会实 中,文化课程的教育很重要,其他三个因素也很重要。性格 践活动教育教学能力较强的只占到1%,其他两项比例为0。 的转变可操作性比较差,主要班干部又受学生管理其他因素 3.规则:10,30=>50 suppo ̄:24%confidenee:86% 的影响,不可每个人都当干部,所以应当积极组织动员学生 20,30=>50 suppo ̄:24%confidence:83% 参加各种有意义的社会实践活动,以提高学生教育教学能力 30,40=>50 suppo ̄:20%confidence:87% 以及其他方面的综合素质。 】05