2011年8月 湖北第二师范学院学报 Journal of Hubei University of Education Aug.2011 第28卷第8期 V01.28 No.8 Bibexcel在文献计量分析中的应用例说 刘齐平 (华中师范大学信息管理系,武汉430072) 摘要:文献计量方法主要是运用数学和统计学处理手段,将文献信息交流过程中的基本规律用数学模型表示出来。本 文对近三年有关Education2.0的研究文献做一个简单的计量分析,例说Bibexcel作为一种文献计量工具的简便应用 效果。 关键词:文献计量分析;Bibexcel;应用实例 中图分类号:TP39 文献标识码:A 文章编号:1674-344X(2011)08-0083-02 作者简介:刘齐平(1988一),女,湖北武汉人,硕士研究生,研究方向为情报学。 文献计量方法是反映情报学特色的定量化方法之  ̄aatel吖I t.A Legesse M 一它为文献信息的搜集、加工整理、分析预测、测评、 BelayM ,御es3eK 传递利用等环节提供强有力的分析研究支持。而由瑞 ManayeK MaciasC 典科学家佩尔松开发的文献计量学研究软件Bibexcel £rko B Charte=AG WaRer£G 是用于帮助用户分析文献数据或者文本类型格式的数 PoleyST 3 3 2 2 2 2 2 2SheldonGF 据。它处理的数据来自集成在ISI Web of Knowledge Rjdc甜摹TC MeyerAA 平台上的数据库,包括Web of Science数据库、Derwent vd ^f Dnuattro P Innovaiton Index数据库和Medline数据库等o Bibexcel 除了对来源于上述数据库中数据的相关知识单元,比 图1 每篇文章的作者分布情况 如:作者、关键词等做频次分析和排序外,还实现了知 章有7位合作的作者,第二篇文章有6位合作的作者 识单元的共现矩阵。 等等。这样就很清晰地看出每一篇文章的作者数目以 首先,选取文献信息索引数据库Web of Science 及具体情况。并且我们发现多数文章常常都是由多数 作为目标数据库,进行源文献检索。设定检索标题或 作者合作共同完成。这也表明了在Education2.0的领 者主题为Education 2.0,检索时间为近三年即2009至 域,学者合作交流的情况较为普遍。 2011年,开始检索,得到458条检索记录。在文献类 2作者频次降序 型中选择类型为Article进行精炼,最后得到423条检 选中savedrees.out,在Frequency distribution下拉 索记录。将全部423条记录,包含摘要以纯文本的形 列表框中选择whole string,在下面的复选框中选择 式保存到本地,系统自动命名为savedrees.Ixt。然后, “Sorted descending”,点击Start按钮,在弹出的窗口 将下载下来的记录集合savedrecs.瞰以Word形式打 中,点击“确定”,生成后缀名为savedrecS.cit文件。 开,选择Windows(默认),简体中文(GB2312)为文本 编码方式,点击确定。这样得到有序的word形式的记 录。然后将其另存为txt格式。这样使得原来下载下 来的无序的记录有序化。将有序化后的savedrecs.txt 置于Bibexcel的安装目录之下。得出分析结果: 1作者分析 选中savedrecs.doc文件,点击View ifle按钮,The llst窗口就会显示这个文件的内容。在Old Tag中填 写关键词对应的标签代号AU,在Select field to be 图2作者出现频次的降序排列 analysed下拉列表框中选择“Any;separated ifeld”,然 图2说明的是关于Educaiton 2.0主题研究的学 后点击Prep按钮,在弹出的对话框中点击“确定”,生 者的产出情况。其中,Lipton RB以及Lewis CE是这 一成后缀名为savedrecs.out文件。在The List窗口显示 领域最高产的作者,他们分别有三篇的文献贡献。 的数据如下: 而其他的学者大多是有两篇或者一篇的文献产出。 图1说明的是每一篇文章的作者,比如第一篇文 收稿日期:POll一07—02 ・83・ 3作者共现分析 下面的复选框中选择“remove dup licate”和“makenew 选中savedrecs.out文件,在Frequency distribution 下面的复选框中选择“remove dup licate”和“make new out—file”,点击Start按钮,在弹出的窗口中,点击 “确定”,生成后缀名为savedrecs.OUX文件。 4 巳.屺a阳ng en z u out—file”,点击Start按钮,在弹出的窗口中,点击“确 定”,生成后缀名为savedrecs.OUX文件。然后选中 savedrecs.cit文件,点击“view file”,在The List显示 4 2 Internet Web 2.0 EducationEvaluation 2 2 2 2 1 D融betes E蛳巾 b口y educationWeb 2 0 epidemioio HⅣ prevalence 窗口中选择频次大于等于2的前48位作者作为分析对 象,然后点击“Analyze—co—occurrence--select unitsvia iisthox”,选中savedrecs.oux文件,点击“Analyze--co~ Intemet MedicaI education metabolic syndrome 1 1 adotescents adolescents educatio ̄ ch勰rl ̄rl ~ 暴ogctliTence--make pairs via listbox”,在弹出的窗口中点 击“否”,此时生成savedrecs.COC文件。 2 Bigal E Liptor ̄q8 8uhr HJ Lauscher JC Sur口IO KLGoode PS 8uhr HJ Rrtz JP i Fdliet H Womngen U Faller H Vogel 2 Goode pS IAorkiandAD Gtone j Lauscher JC Goode PS Redden DT 2 Foloif H Meag K 2 F8艟r H Rossband H 2 FaI}er H Seekatz B 2 Dunstan DW 0werl N NakarnuraY Uda H Kessler RC Nakarnura Y 翻3 共现的频次以及作者 图3表示的是两两作者的共现合作的情况,常常 出现两位作者在两篇或者一篇文献中出现合作,共同 产出一篇较高质量的文献。 4关键词的降序排列 在Old Tag中填写关键词对应的标签代号DE,在 罴 伸 Select ifeld to be analseparated ifeld”,然后点击Pr眦.暑{;。yz ed下拉列表框中选择“Any; ep按钮,在弹出的对话框 中点击“确定”,生成后缀名为s鲫 蜥 avedrees.out文件。选 中savedrecs.out,在Fr嘶 equency distribution下拉列表框 中选择whole string,在下面的复选框中选择“Sorted descending”,点击Start按钮,在弹出的窗口中,点击 “确定”,生成后缀名为savedrecs.cit文件。 图4 关键词出现频次的降序粥}列 图4显示的是在423个文献中,关键词出现的频 : 降序{=i}列。我们可以看到Education、Web2.0都 岛频率出现的关键词汇,它们分别出现_『28、22次。 随后我们看到诸如e—learning等关键词出现的频率 也是很高的。 5关键词共现 选中savedrecs.out文件,在Frequency distribution 84 l1… !ct . ! 鼍篡 ~~ 图5 关键词共现频次降序排列 图5中我们看到在这些文献中的关键词共现的降 序排列情况。比如E—learning和Web2.0以及 Internet和Web2.0等词对共现频率比较高,达到了4 次。依次有共现2次或者1次的关键词对。从图中我 们可以看到关键词出现共现频率的具体分布情况。 关键词共现矩阵: Eaucatmt ̄ Web20 Interact m 蚺leducetlon E- ̄earnmg Ep em b 0be5tv Ombetes o 2 0 o 1 0 1 O O o 2 0 O o 0 o O O 0 O o O 0 2 0 0 0 0 0 0 o O 2 o o o o O O O 1 0 o 0 o 0 0 0 O 0 o O O 0 0 O O O O 2 1 O 0 o 0 o 0 O 0 0 o O O 0 o O 0 O 0 0 0 0 0 o o 0 O O O 0 o O o o 0 2 o O 0 0 o O o o o 0 o ' 0 0 o O O o o 0 0 0 O O 0 0 O o o o 0 0 1 0 o 0 0 o 0 0 o O O O 图6 关键词共现截图 图6中我们截图了部分关键词共现的矩阵排列, 由此观察到某两个词对会有两次、一次或者零次的 共现。 关键词可视化分析:选择出现频次较高的关键词 为对象,采用同上的方法,绘制education2.0领域的共 词知识图谱,如下图所示: I ∞ “ 。 0 _ 。 ●0 ■ ∞ ●0 图7 关键词的可视化分析 在图7中我们看到了,有一些关键词出现相互共 现联系比较多,比如diabetes和epidemiology等,而有 些关键词是单独出现的,比如smoking、internet等。 小结:本文主要是通过文献计量分析工具 Bibexce1分析近三年来有关Education2.0的研究文献 信息,从中我们认识了这一研究中的文献及其生产者 的分布特征,有利于指导学者们的研究和学习。