与改良型CNN模型准确率差异性研究
张逸方 吴佩芬
文字探勘(Text Mining)是自然语言处理(Natural 经网络的概念进行文本分析,并大量运用在电影影评Language Progressing,简称NLP)领域的研究重点,分析领域。本研究以IMDb的影评评论为文本对象,提也是AI人工智能与语言学的学习分支。伴随着网络时出一种改良型卷积神经网络(Convolutional Neural 代的来临,越来越多的人在网络上发表自己的观影意Network,CNN)的模型架构,比较不同神经网络架构、见,有许多学者运用文字探勘方法,搜集网络上的影层数以及参数是否会影响到模型的准确率。
评数据,进行文本情感分析。
配合网络与社交平台的快速发展,电影的评分网一、相关研究
站也成为在线参考电影信息和表达影评意见的重要平台,电影评分网站中,又以IMDb(Internet Movie (一)应用WEKA于电影评论之机器学习演算Database)在全球最具代表性与影响力。IMDb成立于2014年学者藉由数据探勘工具WEKA进行数据探1990年,囊括了全球几乎所有电影及演员、导演、剧勘,进行电影评论分类准确性实验[6],考虑算法及各情、影评等讯息,共计约四百多万条作品数据。
自参数均会大幅影响最后成效,各个不同算法与参文本情感分析的方法众多,主要途径可分为两
数的组合数量让人难以选择,WEKA工具利用贝氏优化种[1],
一种是“词汇法”[2][3],另一种是“机器学习法”(Bayesian optimization)的创新做法,为一种完(machine learning method)
[4]
,“词汇法”从语言全自动化的方案,实验结果发现,其模型准确率约为学的角度出发,以专家分类的情绪词为基础,分析文本80%,如图1所示。
情感倾向[5];“机器学习法”则将大量人为判断的训练(二)类神经网络原理
数据,进行特征选取与模型的建立,利用机器自动判类神经网络(Artificial Neural Network, 断数据意见倾向。在多年的发展下,两类研究方法不ANN)为基于脑以及神经网络基础而发展的信息处理断地互相影响,累积了诸多的资源、模型与数据库。
技术,为人工智能的延伸应用。类神经网络因为具有推配合深度学习技术的演变,学术界也开始使用神
理、记忆、容错等特性,也可以说是一种特殊技术的统
图1:WEKA用于电影评论之准确率
【作者简介】 张逸方,男,中国人,彰化师范大学财务金融技术学系管理组博士候选人、艺术大学广播电视学系兼任讲师、主要从事电影创作、电影投资数据分析研究;
吴佩芬,女,中国人,彰化师范大学资讯管理学系副教授,设计学博士,资深数位媒体设计者,主要从事跨媒体数位设计、创新数位媒体整合设计分析研究。
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.59
电影理论
FILM THEORY计应用,它不需要关于数据的分布假设,具有建构复杂能处理许多非线性与连续函数映对问题能力等特色[7],
过去统计方法无法处理的非规则性问题,不局限在影
[8]像、文字、语音等领域,在商业领域也有很大的作用。
性的特点,对预测模型的输出结果进行改进之后,输出结果既能更可靠地反映电影在上映期间的票房收入,又能指出电影票房的波动范围;陈增艳[13]为了缓解卷积神经网络在计算和网络训练过程中出现的“过拟合”现象,寻找合适的Dropout值降低过拟合问题,在一定程度上参照了协同过滤算法中的相似度计算,发现研究评分预测的准确度被大大提高;王锭等人[14]提出一种基于卷积神经网络的电影评论情感分类模型,将卷积神经网络与词向量相结合,并与SVM等传统机器学习方法进行对比实验。实验结果表明,基于卷积神经网络的文本情感分析模型有较高的准确率。
综观以上研究方法,目前相关研究中,多数基于神经网络模型结构进行微调改进后,进而以改良模型预测电影票房及评论;本研究将借由建构改良型CNN模型,建构IMDb影评分析系统,和以往研究不同的是,本研究考虑模型结构全连接层层数以及神经元多寡对准确性的影响,经由各种神经网络组合实验,找到准确性优化研究,提升模型应用之效益。
类神经网络是模仿人类神经元结构之概念,其神经元反应的基本逻辑,包含输入层(a1~ai)、权重(w1~wi),输入乘上权重之后加总(∑w*a),便可得到神经元的刺激强度,接着经过函数(f)转换以及调节刺激强度的阀值(b),即可得到输出的神经元刺激强度,数学公式如图2。研究者基于神经元操作模式,发
[9]展出单层神经网络,模型概念如图3。
图2:单一神经元数学公式
二、研究设计
(一)卷积神经网络之模型概念
图3:单层神经网络
卷积神经网络(Convolutional Neural Networks,CNN)为神经网络的分支之一,核心为沿用了多层感知器(Multilayer Perceptron,MLP)的结构,由输入层(Input)、卷积层(Convolutional Layer)、池化层(pooling)、全连接层(Fully-connected Layer)组成。由Kim[15]提出的CNN短文本分类模型结构如图5所示。
本研究将建立TensorFlow的训练环境,使用Keras作为架设模块的基础,以Keras建立神经网络进行深度学习训练。
(二)研究数据与步骤
本研究采用IMDb电影评论情感分类数据库25000份电影评论作为分析数据[16],本研究实验分为两个部分,第一部分为多层模型实验,第二部分为神经元数实验。其中多层模型实验主要目的为比较全连阶层数对单一类神经网络与改良型神经网络准确性差异分析,而神经元数实验目的为了解模型参数的改变对准确度的影响,针对模型参数,如卷积层、滤波器、卷积核大小等,了解不同模型参数设定对准确度的影响。研究步骤如图6所示。
多层模型中如图4,隐藏层的神经元个数和层数可以由研究者自行决定,一般而言,当隐藏层及神经元
[10]越多,处理非线性的问题能力越强。
图4:多层神经网络
(三)类神经网络在电影预测之应用
过去类神经网络模型在电影产业的应用很多,Ramesh and Dursun[11]曾运用统计方法与类神经网络,创建电影票房预测的模型并进行比较,发现类神经网络的模型较佳;郑坚等人[12]提出一种基于回馈神经网络的电影票房预测模型。发现针对神经网络波动
60
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.2021第07期 图5:CNN文本分类模型结构[16]
型模型的准确率与模型性能,分别将进行两模型之对比实验。
本研究首先针对多层模型实验的准确率进行比较,两模型准确率变化如图7所示。改良型CNN模型中,整体模型稳定性较单类神经网络模型高,而卷积层数的改变则对模型准确率的改变不明显。
图6:研究流程图
(三)研究参数
研究参数直接影响最后的模型结果,表1表2列出本研究单类神经网络模型与改良型CNN模型中,欲研究之参数与对应的参数值。
表1:多层模型实验之研究参数设定
单类神经网络改良型CNN神经网络图7:2种模型多层准确率比较
参数值参数值501另外针对神经元实验的两类模型准确率,不同神全连接层数500,50卷积层数2经元数对模型准确率变化比较如图8。改良型CNN模型(Dense层数)500,400,503500,400,300,50(convolution)4中,滤波器数的改变对准确率有明显变化,而改良型500,400,300,200,505CNN模型中,其卷积核大小的改变则对准确率的改变表2:神经元数实验之研究参数设定
不明显。
单类神经网络改良型CNN神经网络参数值参数值参数值5083神经元数100,50滤波器数16卷积核大5(Dense)200,507300,50(Filters)32小(Kernel)9400,5012811三、研究结果
为了了解本研究提出之单类神经网络与CNN改良
图8:两种模型之神经元实验比较
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.61
电影理论
FILM THEORY结语
本研究以IMDb电影评论为数据,基于过去WEKA对电影评论算法的模型准确度评估,提出以类神经网络为基础的单类神经网络与改良型CNN模型,由此实验了解如何改变关键参数,找到可信赖模型的准确度区间,避免未来研究者在选择参数时造成过高或过低的准确率。研究发现,单类神经网络在参数较少时,其模型准确率较高,而改良型CNN模型层与层之间为局
部连接的特性,模型可承受较多的参数设定,如多神经元数与多层数,其模型稳定性及准确性均较高,且基于文字探勘的特性,可发现CNN之滤波器并不需要过多的滤波器数,即可达到不错的准确率。
自然语言学习中的文字情感分析的研究仍存在许多问题,需进一步讨论,但本研究发现,文字情感分析可用不同的类神经网络模型进行评估,可提高可信赖度的准确率,后续将再透过不同的类神经网络模型进行模型架构之适用性比较。
参考文献:[1]Serrano-Guerrero,J.,Olivas,J.A.,Romero,F.P.,&Herrera-Viedma,E.Sentiment analysis:A review and comparative analysis of Web services[ J ].Information Sciences,2015,311:18-38. [2]Taboada,M.,Brooke,J.,Tofiloski,M.,Voll,K.,& Stede,M.Lexicon based methods for sentiment analysis[ J ]. Computational Linguistics,2011,37;267-307.[3]Turney P,Littman M.Measuring praise and criticism:inference of semantic orientation from association[ J ].ACM Transactionson Information Systems,2003,21(4):315-346.[4]Boiy,E.,& Moens,M.-F.A machine learning approach to sentiment analysis in multilingual Web texts[ J ]. Information Retrieval,2009,12(5):526-558. [5]Xu R.F,Wong K.F,Xia Y.Coarse-Fine opinion mining-WIA in NTCIR-7 MOAT task[C]//Proceedings of NTCIR 2008:307-313.[6]A data mining experiment:movie reviews classification using WEKA.[EB/OL].[2019-11-15]https://www.stefanoscerra.it/movie-reviews-classification-weka-data-mining/.[7]Tan S.,Zhang J. An empirical study of sentiment analysis for Chinese documents[ J ].Expert Systems with Applications,2008,34(4):2622-2629.[8]Vellido,A.,Lisboa,P.J.G.and Vaughan,J.Neural Networks in Business:A Survey of Applications(1992-1998)[ J ]. Expert Systems with Applications,1999,17:51-70.[9]叶怡成.应用类神经网络[M].台北:儒林图书公司,2001.[10]Hearn,D.,&Baker,M.P.Computer graphics[M].Englewood Cliffs,NJ:Prentice-Hall,1986.[11]Sharda,Ramesh and Delen,Dursun.Predicting box-office success of motion pictures with neural networks[ J ]. Expert Systems with Applications.2006,30(2):243-2.[12]郑坚,周尚波.基于神经网络的电影票房预测建模[ J ].计算机应用,2014,34(3):742-748. [13]陈增艳.基于卷积神经网络的电影推荐模型研究[D].大连:大连海事大学,2018.[14]王锭,杜红等人.基于深度神经网络的电影评论情感分类研究[ J ].电脑与信息技术,2019(4).[15]KIM Y.Convolutional neural networks for sentence classification[C]//Proceedings of Conferenceon Empirical Methods in Natural Language Processing.Doha:[s.n.]p.1746-1751,2014.[16]林大贵.TensorFlow+Keras深度学习人工智能实务应用[M].台北:博硕文化,2017.62
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- sceh.cn 版权所有 湘ICP备2023017654号-4
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务