毛纺科技 一56一 WOOl Textile Journal 第45卷第3期 2017年3月 DOI:10.19333/j.mfkj.2016100100306 基于内存计算的纺织生产设备电能耗分析方法 王中锋 (河南工程学院,河南郑州451191) 摘 要:节能减排影响着纺织生产企业的生存和发展,通过分析设备的耗电情况实现精细化管理是一种减少 生产能耗的途径。但是,在针对电能耗大数据进行分析时,基于Hadoop的计算框架无法暂存分析的中间结果,分 析效率低。文章采用Spark计算框架,提出一种基于内存计算的设备耗电情况分析模型和毛纺流水线电能耗分析 方案,依据毛纺工艺流程设计电能耗分析的处理流程和电能耗分析管理系统,利用Mahout类库实现分析算法。实 践证明,内存计算技术的应用在提高毛纺企业生产设备电能耗分析效率的同时,还提升了生产过程的精细化管理 水平和企业的竞争力。 关键词:节能减排;纺织;内存计算;电能耗 中图分类号:TS 10 文献标志码:A Analysis method of electrical energy consumption of production equipment in textile enterprise based on memory computing technology WANG Zhongfeng (Henan Institute of Engineering,Zhengzhou,Henan 45 1 1 9 1,China) Abstract:The survival and development of textile production enterprises is affected by energy conservation and emission reduction.By analyzing the electrical energy consumption of the equipment can reduce the energy consumption of the production process.However,it is dificult to meet analysis requirements of large energy consumption data based on Hadoop.This paper presented an energy consumption analysis management system for wool textile production equipment based on memory calculation,and designed the processing flow of electric energy consumption analysis program according to the wool spinning process flow.The analysis model of energy consumption was designed using Spark calculation framework.And the analysis algorithm was realized by class library of Mahout.Practice has proved that the application of memory computing technology is not only improves the eficiency of energy fanalysis of production equipment,but also improves the fine management level of the production process and the c0mpetitiVeness of enterprises in the wool textile enterprises. Key words:energy conservation and emission reduction;textile manufacturing;memory computing technology;electrical energy consumption 虽然“十二五”时期,纺织行业节能减排的目标 收稿日期:2O16—10—10 基金项目:河南省科技厅基础前沿项目(162300410186);.郑 州市科技局基础前沿项目(20141365);2017年度河南省高 校重点科研项目(17A520028);2017年度河南省高校科技创 新团队支持计划项目(17IRTSTHN008) 作者简介:工中锋,博士,主要研究方向为数据挖掘、纺织节 能减排。E—mail:iewzf@163.corn。 任务全面完成,但是“十i五”时期,我国纺织行业 节能减排形势仍然十分严峻,任务艰巨。同时,随着 资源节约型、环境友好型社会加快推进,对纺织工业 节能减排、淘汰落后提出更高要求 。 中国纺织工业联合会环境保护与资源节约委员 会先后组织开展的“纺织工业企业百万节能义诊” 45卷 2017 3期 3月 己 拔 WO0l Fextile Journa (简称“纺织『 业 万节能义诊”)和“ 能服务进万 ,家”等活动指….应川火数据技术 ;进物联网建设 是 1前纺织 业进行 能减排,以及而对自动化、智 能化发展趋辫的必然选择 纺织个、i 经 成小主要包括材料成本、人力成 小、能耗成小和管用成本4人项。¨前,国内外纺织 、Il,和科研机构 材料成小管理、人力成小管理和 汽一 25%,水和天然气消耗{i{=较少,说【1月fU能牦的 降低对毛纺织企业节能1一作彳『重要意义..1 缄,L成 过程能耗结构 罔I 管州 成小管理方 有较多投入,f【l住能牦b 本管 理,J 而投人较少 一方而,纺织 业管理人员似设 供lU 业 经进行 深人的研究,fIIl供电 、 关心 的承点是能牦量的汁量和 …现蚌常朋电情况, 圈1 呢绒生成过程能耗结构 许 关心 产没箭的能牦; )一方断,纺织 业的生 产经营更倾向于高能耗高产…的短期效益模』\=。川 提离精细化符理和 卜产技术来提高竞争力, I然能 够他 业具仃K 的竞争力,但 }9】投人人,见效 性 随荇 家节能减排政策的实施 1j.引导,纺织企 f『1科研机构已 始重视这 面的研究. .l-2 电能耗流向分析 越妍 分析丁纺纱]一 『f1能牦的流向 研究 表明【U能消耗主要集-l 在清化机、梳棉机、滤 装 置、精梳机、J{:条机、 fl纱机、细纱机、『1动络简、倍 “纺织I 业百万 能义诊”活动信息化 能分 组成员对凋研过的一些企,lkl乜能耗精细化管理提… 了处理建议,探讨j’纺织生产过程巾如何J、 川大数 据处理技术分忻电能牦,实现 能减排 、 捻、烧毛、倒筒、空洲、地吸等 川设衍卜;液化气主 要川丁烧毛机烧掉纱线表 纤维;水 要消托F令 调加 、降温及冲卫等;fLI求水主要消托丁 !I 饮川 水和食堂川水;油士 消耗丁厂I大J 1 辆和 问愉修 前,纺织 、 啦川Hadoop软什平台处州物联 网人数据 足, 丁Hadoop的MapReduce汁 并: 架为_r适应批处理运钟:,存进行数据分析的迭 l 此,借助新技术和新方‘法临测分析,li产设符IU能 牦,足优化q|J 过 的前提, 约IU能牦的天键,赴 实现1,能减排、增产增效【_1 的主要途径 纺纱I 艺流 罔2. 代运算时,不对中 结果进行存储,需要反复渊J}J存 储 外存的数据,分析效率1 高 本史艰丁内存运算平台Spark榧架 “,懂J1 J Mahout类库 设汁纺织设衙电能牦分析模型,将 2 生产设备电能耗分析模型 小文以_E纺织 、I 为例介绍Spark模型的组成 迭代汁箅的l11问汁算结 暂存在内存巾,减少分析 过 f11的输人输flI操作,提商了分析运算的效率 干u功能设 .使川的设备包括:和t机、梳tfJ【、ji: 条机、'卡H纱机、细纱机、络简机等. 系统总 结卡勾『司包括数据采集帧块、 静数 库、大数据井f 处胛平弁、数据分析模块和 务逻辑 模块 1 纺织生产电能耗现状分析 1.1 电能耗比例分析 通过埘参与 能减排义诊活动的纺织 业能耗 数据采集模块通过智能I乜丧按 一定的 半分 别采集和_屯fJ【、梳屯fJ【、并条饥、粗纱机、细纱机、络 筒机的电流、I 、仃功功率 尤功功率:通过 联 数扔 的统汁.可以比较得…}也能是毛纺织, 产的主 能牦、 这些参JJI]义诊活动的 业均为旧内外 纺织 网网络协c义发送剑事务数扔 中的实时设箭能牦数 据集,利川sqoop 人数抓j1: 处 半台进仃数据 交换 大数 片仃处 平白果川HDFS存储数据, 应J十】Spark¨‘箅框架 现火教据运算,应川Ma hflL l 实现人数据分析。jf:提供Canopy分析、k-Means分 、I ,通过 1SO9001:2000质 管理体系、 Is()l400l环境管理怵系 苏Ii f{‘选择了一个典, 的大型纺织 、 ,通 过 务{:{{= :彳丁关的资料,分析主要能牦指标,{ll!-示能 源【 陔 、I 总生产成本的13.19%左有 说lJI】 能 减排对 、 的生仃和发展起荇:作常五要的作川,特 刖址呢绒 产过程rfI各种能源消耗电力 75%,蒸 析、Mean—Shift分析、I).richlet分析、 尔科夫模J 和 贝叶斯网络模 技术求分析电能牦的情 :分忻结 果通过sqoop传送到 务数据库叶I的分析结 数据 毛纺科技 一第45卷第3期 58一 WOOl Textile Journal 2017年3月 图2纺纱工艺流程 集,结合用户信息数据集,提供给业务逻辑模块,实 I ………一 ………一]r…一 I I 现用户的应用。 在整个电能耗模型中,除了事务数据库和大数 据并行处理平台之间通过sqoop进行转换外,各个 模块之间均通过TCP/IP协议进行通信。系统总体 结构见图3。 冈圈图图图团 .一一一一一一一一 3 毛纺流水线电能耗分析方案 以毛纺工艺流程和毛、梳毛、并条、粗纱、细纱和 络筒为例,通过设备电能耗分析方案实现节能减排 和故障诊断的方法。 ! 一一一 l 1分析结果数据集 L——————————-J事 匝 蓁 l实时设备能耗数据集l厂—————————] 库 3.1 电能耗分析程序处理流程 以2台细纱机为例描述电能耗分析程序的处理 工作流程。对于和毛机、梳毛机、并条机、粗纱机和络 筒机,可以采用类似细纱机电能耗分析程序的处理工 r……一………[二 !__I_ I___ …一~-三 二…一一I___ I_-_I___ 一 作流程来解决。对于多于2台的同类设备,可以并联 人处理流程。细纱机应用程序处理流程见图4。 从图4首先读取每台细纱机的电流、电压、有功 功率和无功功率,并判断当前的电流、电压、有功功 率和无功功率是否异常。若未出现异常情况,进行 电流波动分析、电压波动分析、有功功率波动分析或 无功功率波动分析,并针对有功功率分析和无功功 率分析的结果对设备能耗进行排序,结合员工信息 对各个员工的生产耗电情况进行分析,结合产量信 息实施能耗、单产分析。若出现异常情况,则进行设 备异常分析。 3.2 电能耗分析管理系统 电能耗分析管理系统由6个子系统构成,采用 第45卷第3期 毛纺科技 WOOl Textile Journal 一59一 2017年3月 纱机电能耗分析系统和络筒机电能耗分析子系统。 这些子系统虽然工艺上有先后,但是相互之间是并 行关系,统一由其上层纺织企业生产设备电能耗分 析系统并发管理。 对于每一个电能耗分析子系统,都采用智能电 表记录设备的能耗信息存储到对应的数据库中,并 由相应的子系统进行管理。这些能耗信息是设备能 耗的基础数据,为节能减排提供分析依据。 在各个子系统中,都能对该系统内部的数据进 行统计分析。除了通常的查新统计功能外,均提供 能耗/单产分析功能、员丁耗电分析功能、设备能耗 排序功能、设备异常分析功能、电压波动分析功能、 电流波动分析功能、有功功率波动分析功能、无功功 率波动分析功能等应用。 纺织企业生产设备电能耗分析系统采用统一的 可视化呈现界面与用户交互。各个子系统采集、处 理、分析的结果以相同的方式提供给终端用户。另 外,为了提高系统的可靠性,设计同步机按照一定的 频率收集子系统数据库的数据,一旦出现停机或者 故障,可以重启系统。纺织企业生产设备电能耗分 图4细纱机应用程序处理流程 析管理系统见图5。 用户呈 现界面 同步机系统 启动/重启 l 分析子系统 分析子系统 分析子系统 l 分析子系统 1. 分析子系统 』 分析子系统 和毛机电能耗 梳毛机电能耗 并条机电能耗 粗纱机ca能耗 细纱机电能耗 络筒机电能耗 能耗/单产分析 能耗/单产分析 能耗/单产分析 能耗/单产分析 能耗/单产分析 能耗/单产分析 员工耗电分析 员工耗电分析 员工耗电分析 员工耗ca分析 员工耗电分析 员工耗电分析 设备能耗排序 设备能耗排序 设各能耗排序 设备能耗排序 设备能耗排序 设备能耗排序 设备异常分析 设备异常分析 设备异常分析 设备异常分析 设备异常分析 设备异常分析 电压波动分析 电压波动分析 电压波动分析 电压波动分析 电压波动分析 电压波动分析 电流波动分析 电流波动分析 电流波动分析 ca流波动分析 电流波动分析 电流波动分析 有功波动分析 有功波动分析 有功波动分析 有功波动分析 有功波动分析 有功波动分析 无功波动分析 无功波动分析 无功波动分析 无功波动分析 无功波动分析 无功波动分析 —、 、 、 —、 、 —、 Jr 上 { I 钏 l 钏 l I T I T I T l I T l I T lI T /电\数能据耗A V ( 0 \ (数据 \J ( 0 /电\ 数能据耗A \/ ( 0 l智能电表Il I l 智能电表ll I智能电表I l智能电表l l智能电表I ll智能电表l l图5 纺织企业生产设备电能耗分析管理系统 3.3基于Spark的电能耗分析过程 电能耗的分析过程是在Spark计算框架上实现 的。基于Spark的电能耗分析方式图见图6。 在图6中,MySQL数据库管理系统将设备能耗 毛纺科技 一第45卷第3期 60一 WOOl Textile Journal 2017年3月 图6基于sp盯k的电能耗分析方式图 数据利用sqoop传输给HDFS大数据文件管理系 统。通过Mahout提供数据挖掘算法分析设备能耗 数据,并以Spark大数据分布式编程框架实现分析 算法。Spark是一种分布式计算,与Hadoop一样,基 于map reduce算法实现,因此具备Hadoop MapReduce的优点;Spark与Hadoop不同的是,在处 理具有较多中间运算结果的算法时,Spark的效率 较高。这是因为Spark运算的中间结果可以存储在 内存中,减少了反复读写HDFS的过程。因此Spark 框架更适合需要应用数据挖掘与机器学习算法分析 设备能耗的应用。 基于Spark框架的Mahout分析包括 Transformation和Actions两部分。Transformation部 分是一个分布式的过程,在这个过程中操作的对象 是弹性分布数据集(Resilient Distributed Dataset, RDD) 。在Transformation时,使用了链式调用的 设计模式,对每一个RDD进行计算后,只能变换成 另外一个RDD,然后这个RDD又可以进行另外一 次转换。 RDD具有把中间输出和结果保存在内存中处 理的功能。图6中的RDD表示能耗数据集合,这些 数据已经被分区,且不可变,并能够被并行操作。选 择用RDD来保存这些能耗数据,是由系统的应用场 景决定的。由于在能耗分析算法中会产生大量中间 运算结果,若采用MapReduce模式,需要反复与外 存交换这些中间结果。而选择用RDD来保存能耗 数据时,每次的中间操作结果都可以缓存在内存中, 省去了大量内外存交换的工作量。提升了分析 的效率。 作为输出,Actions部分的返回值不是一个 RDD。其值可以是一个Scala的普通集合,或者是 一个值,或者是空,最终或者返回到Driver程序,或 者把RDD写入到文件系统中。 基于Spark计算框架实现的电能耗分析方式, 提升了这些分析算法可处理的电能耗数据量和分析 处理性能。 3.4 电能耗分析算法模型 电能耗的分析方法是利用Mahout提供的分析 模型实现的,本文涉及的业务应用及对应的数据分 析模型和调用的Mahout算法分析方式见图7。 ~: 赢一 f.-- 一、 并行FP Growth算 i — 局部加权线性回 归 逻辑回归 —有功波动分析『———————————l/ L—●I,,’^M—、 区_广 _ 一 —~ l 贝叶斯 支持向量机 感知器算法 l,』/I 神经网络 i—— 随机森林 有限波尔兹曼机 云: 三三 i./ 坌 Canopy聚类 K均值算法 模糊K均值 期望最大化聚类 —蓦 .员.— 工..—能.—.耗— .分。 —.—析_JlI Ih V/、、 ,L—冒— ——z— 士一 均值漂移聚类 层次聚类 狄里克雷过程聚 类 LDA聚类 能耗/单产分析 . 厂 = 谱聚类 计算列问相似度 计算向量问距离 圈7 基于Spark的电能耗分析方式强 在图7中涉及到图4提到的应用程序处理流程 包含的8类业务分析模型,这些业务分析模型需要 应用到数据分析模型来实现。其中,电流波动分析、 电压波动分析、有功功率波动分析或无功功率波动 分析需要调用回归分析方法和关联分析方法;设备 异常分析需要调用回归分析、分类分析和聚类分析 方法;设备能耗排序、员工能耗分析和能耗/单产分 析需要调用聚类分析和统计分析方法。这些数据分 析方法通过调用Mahout算法实现。回归分析方法 调用并行FP Growth算法实现,管理分析方法调用 局部加权线性回归算法实现,分类分析方法调用逻 辑回归算法、贝叶斯算法、支持向量机算法、感知器 算法、神经网络算法、随机森林算法或有限波尔兹曼 机实现,聚类分析方法调用Canopy聚类算法、K均 值算法、模糊K均值算法、期望最大化聚类算法、均 值漂移聚类算法、层次聚类算法、狄里克雷过程聚类 算法、LDA聚类算法或谱聚类算法实现,统计分析 第45卷第3期 毛纺科技 WOOl Textile Journal 2017年3月 方法调用计算列间相似度算法或计算向量间距离算 法实现。 [5] with performance analysis using K—means[J].International Journal of Computer Applications,2015,113(1):8—11. Meng X,Bradley J,Yavuz B,et a1.MLlib:machine learning in 4 结 语 本文中提出的纺织企业电能耗Spark建设方 apache spark[J].Journal of Machine Learning Research,2016, 17:1—7. [6] ShanahanJ G,Dai L,Cao L B.Large scale distributed data science using Apache Spark:In Proceedings of the 21 th ACM SIGKDD Inter—national Conference on Knowledge Discovery and Data 案,通过分布式内存处理方式提高了纺织生产设备 电能耗分析的效率,不仅达到节能减排、降低成本的 目的,还提高了纺织生产过程的精细化管理自动化 Mining[C].Sydney:ACM,2015:2323—2324. 和智能化水平,提升了企业竞争力。 致谢:感谢河南工程学院苏玉召和郑州航空工 业管理学院赵妍对本文研究提出的宝贵意见。 参考文献: [1] 苏玉召,基于物联网的纺织业节能减排跟踪检测方法[J]. 毛纺科技,2014,42(8):57—61. [2] 王军,刘文化,于伟东.一种基于Hadoop的纺织海量生产数 据存储设计[J].微型电脑应用,2013,30(6):53—54. [3] 邵景峰,贺兴时,王进富,等.大数据环境下的纺织制造执 行系统设计[J].机械工程学报,2015(5):160—170. [4] Gopalani S,Arora R.Comparing apache spark and map reduce [7] Eluri V R,Ramesh M,A1・Jabri A S M,et a1.A comparative study of various clustering techniques on big data sets using Apache Mahout:3 MEC International Conference on Big Data and Smart City[C].Muscat:IEEE,2016:1—4 [8] Gupta A.Learning apache mahout classification[M]. Birmingham:Paekt Publishing Ltd,2015. [9] 赵妍.物联网在纺织企业生产中的应用[J].纺织导报,2014 (1):52—54. [10] Zaharia M,Chowdhury M,Das T,et a1.Resilient distirbuted datasets:a fault—tolerant abstraction for in-memory cluster computing:Steven D.In Proceedings of the 9th USENIX Conference on Networked Systems Design and Implementation[C].San Jose: USENIX Association,2012:15—28.