安徽农业科学,Journal ofAnhuiA .Sci.2008,36(21):9097—9099 责任编辑姜丽责任校对卢瑶 ’烟草近红外光谱分析结果影响因素综述 张灵帅 ,邢军2 ,谷运红 ,王卫东 ,焦浈 (1.郑州大学离子束生物工程省重点实验室,河南郑州450052;2.国家烟草质量监督检验中心,河南郑州45O001) 摘要结合国内外研究现状,针对校正集样品选择,样品粒度、含水率、试验因素以及光谱预处理和数学建模方法的选择 烟草近红外 光谱分析结果的影响进行了探讨分析。结果表明:为获得可靠的分析结果,样品选择应均匀、广泛,有较好的代表性,并考虑样品粒度、 合水率及其他因素的影响,同时应选择合适的光谱处理方法和数学建模算法。 关键词烟芋;近红外光谱分析;影响圆索 中图分类号S572 支献标识码A 支章编号Research PI Abstract 0517—6611(20o8)21—09W7—03 s on Fac ̄rs the Determination of Tobacco Consittuent with Near Infrared Reflectance Spectroscopy effectof samplehand]iI1g,chemical ZHANG Ling-shuai et al (Provincial Key Laboratory of Ion Beam Bio-engineering,Zhengzhou University,Zhengzhou,Henan 450052) The analysis oftobacco constituentwith nearinfraled spectroscopyW&S a rapidand accuratetechnique. naal/sis as well as data process methods were investigated wih regards tto the performance ofthe near irrSmed spectroscopy in determination oftobacco onstcituents..I11e analysis paranreters were:lange of samples for calibration;water content and granularity of Sample;erlor relating to chemical analysis; sampleloadingandtestcondition;prelrealxnentmethodforNIR spectnm ̄;regressionmethodfor calibration.In orderto 0btain reliableresults,itWas advis— able to take these variblaes into consideration when NIR model was established for the estimation of the ingredients oftobacco. Keywords%bacco;NearInfrared Spectroscopy;Affectigfnactor 总糖、总氮、烟碱和蛋白质等化学成分的分析是烟草工 业的常规检测项目,对烟叶原料以及卷烟产品质量的控制具 模型要好 3。 计算机识别多根据样本光谱之间的距离差异进行样本 有重要的意义。但这些化学成分的常规检测方法通常都比 较复杂,人为误差大,重复性差,且费时耗财。应用近红外光 挑选,相关的算法有Kennard—Stone法l J和GN距离法 等。 除了这些算法外,主成分分析法也被用于对校正集样品的计 算机辅助选择。李彦周等将主成分分析法用于近红外定量 分析校正集样本的优选,提出了1种根据样本光谱第1主成 分得分优选校正集样本的方法,并使用该方法从418个烟草 谱技术分析烟草化学成分具有简单、快速、准确、无损、重现 性好等优点,因而在烟草行业中应用也越来越广泛H J。但由 于仪器类型、波长范围、测试样品形态等方面存在差异,要获 得准确的分析结果就必须对其影响因素进行研究与分析。 样本中优选得到约105个样本校正集。通过对烟碱成分实 际建模与外部验证,与随机法、含量梯度法2种校正集样本 1样品选取对分析结果的彩响 1.1校正集样品选取校正集样品的选取非常关键,校正 挑选方法的性能进行了对比。结果表明,主成分分析法既克 服了随机法挑选样本代表性不足的风险,又可以避免含量梯 度法必须测定所有样本成分含量而造成的人力物力消耗l6J。 光谱差异选择定标集的方法在很大程度上减少了像常规方 法那样测量基础数据的样品数,降低了建模费用。但这种自 动识别定标集的方法也存在一定的缺陷,如光谱的差异并非 完全由所测样品的组成或性质差异引起,可能是某些随机因 集样品的组成及校正集样品基础数据测量的准确性决定所 建立校正模型的适用性和准确性。选取的校正集样品范围 应尽量广泛,对待检指标有很好的代表性,样品的光谱特征 及其性质范围应能涵盖以后待测的所有样品,且在所测的浓 度和性质范围内,样品应均匀分布,避免共线性现象。 目前,校正集样本的选择主要有常规选择和计算机识别 2种方法。常规选择是根据样本光谱的积累和性质以及组成 数据的分布来选择建立定标集的样品,并通过部分样品进行 验证;而计算机识别则是通过一定的计算模型,识别样本之 间的光谱差距,确定适合校正集的样本l2j。 在实际应用中,常规选择多根据样本的化学成分含量差 异进行样本挑选,常用的是含量梯度法。由于烟叶的产地、 素如样品的温度、粒径大小等因素的差异造成的。 1.2样品粒度 由于样品的粒度影响光对样品的穿透特性 和反射特性,粒度变化使光在样品粒子中的光程发生变化, 从而影响样品对光的吸收系数和散射系数。粒度变化,散射 系数变化,吸光度也随之变化,导致整个图谱发生变化,从而 影响近红外数学模型的预测精度L 。 品种和等级众多,针对不同的情况可以建立不同的模型,在 预测不同的样品时使用不同的模型,这样可以保证模型有较 段焰青等以烟草粉末样品的近红外分析为例,研究了不 同样品粒度对建立烟碱含量预测模型的影响。结果表明,样 品粒度对预测模型有较大影响,细粉末烟叶样品所建的模型 高的预测精度。苏明亮等利用库存的572份烟叶(其中1/3 是云贵烟叶),1/3是福建烟叶,用偏最小二乘法建立了对云 在各项评价指标上均较粗粉末样品所建模型好,且实际预测 贵、福建2个产区的分模型和总模型。从模型的性能指标 看,烟叶近红外产地分模型比总模型性能指标有所提高。从 模型预测结果看,烟叶近红外产地分模型实际应用效果比总 作者简介张灵帅(1981一),男,河南邓州人,博士研究生,从事离子束 生物工程和近红外光谱分析应用研究。*通讯作者,高级 工程师。 准确性高_8j。因此,在应用近红外光谱分析技术分析烟草样 品时,为获得较好的预测模型和较准确的预测结果,烟草样 品应碾磨得足够细,其粒度应>40目。 1.3水分由于含H—O键的水分子在近红外谱带上产生 较强的光谱吸收,会使样品近红外光谱的形状发生改变,因 此,样品中不均匀的水分会对近红外光谱产生明显的影响。 虽然近红外分析中样品一般不需要进行预处理,但对于含水 收稿日期2008—04,28 维普资讯 http://www.cqvip.com
9098 安徽农业科学 2008盎 率较高或水分含量不一致的样品须作干燥处理,否则,校正 集样品间水分含量的不同,会对最终结果的准确性产生 影响。 其对未知样本的预测结果也越准确_1引。所以,在建立定标 模型时,采用公认的标准分析方法对样品进行多次重复测 定,获得准确的化学值是非常重要的。同时,还应该对这些 方法的局限性有所了解。要保证化学值的准确性,必须注意 下列各点:①选用国标方法或行业标准方法测定定标样品; ②在不同时问测定2~3个平行样品,平行样品之间的相对 段焰青等在连续改变样品水分质量分数的条件下,采集 了烟样的近红外吸收光谱,并用预测模型测定了它们的总 糖、总氮和烟碱质量分数。结果表明,烟样水分质量分数的 升高使其在近红外区域的光谱吸收明显增大,直接影响以上 化学成分的测定结果。当烟样水分质量分数>10%时,以上 几种常规化学成分的测定误差随着烟样含水量的降低而减 误差不能大于方法允迕的范围;③测定结果最好以干基含量 表示,这样表示的结果不会因为空气湿度的变化而波动。 2.2仪器及环境因素近红外分析仪的精度取决于仪器的 信噪比,而温度变化是影响信噪比的一个重要因素。温度变 化能够影响仪器波长的稳定性,引起探测器输出阻抗变化, 小,而当样品水分质量分数<10%时,样品水分差异引起的 总糖、总氮和烟碱质量分数测定的误差可以忽略不计 J。所 以为了减少水分对烟草近红外预测结果的影响,应保证待测 样品水分含量与建立模型时条件相一致,且样品水分质量分 数<10%。 相应地导致输出信号的变化,还会引起光源输出的变化,使 测量结果变得不准确。因此,仪器除了要保持恒温恒湿的良 好的工作环境之外,还要保证处在良好的工作状态。除了对 在样品光谱采集过程中,装样条件包括装 仪器充分预热外,许多与仪器配套的软件还提供了一系列的 检测手段,通过检测,再进行光谱采集,可以减少仪器本身造 成的误差。 3光谱数据处理与分析方法的影响 1.4装样条件样厚度、样品松紧度和装样均匀性等因素会对分析结果产生 不同程度的影响。 由于近红外光具有一定的穿透性,因此装样厚度必然对 近红外光谱产生影响。李军会等将样品分别装样并控制在l ~3.1方法选择的影响由于仪器、背景、样品性质及一些随 5一厚度下,进行光谱测试并进行结果分析,其总糖、总 机因素,得到的原始谱图一般都需处理。预处理方式选择适 当可以有效地去除噪声,去除干扰因素的影响,使有用信息 凸现出来,以提高建模质量。谱图预处理主要解决光谱噪声 的去除、数据的筛选、光谱范围的优化及消除其他因素对谱 图信息的影响。 常见的方法是平滑处理(傅立叶变换、奇异值分解、小波 氮、尼古丁预测值在5种厚度下并无明显差异_1…。因此,在 40目左右粒度和>1 n31n厚度的情况下,烤烟样品厚度产生 的误差可以忽略不计,已达到近红外反射测量时的无穷 厚度。 样品的松紧度不同,散射系数也会随之发生变化,从而 使光谱的基线发生平移。另外,样品的松紧度会影响入射光 在样品中的穿透程度和反射特性,从而引起近红外光在样品 变换等)和基线校正(一阶导数、二阶导数、多元散射校正、标 准正态校正等);另外,光谱的标准归一化处理(SNV)及多元 散射校正技术( MSC、)也常用到。闵顺耕等利用不同的预处理 中光程的差异。这样所采集到的近红外光谱中所包含的信 息就不同。所以为了保证每次样品光谱采集时松紧度的一 致性,可以用与样品池配套的砝码垂直压实,每个样品取样 的多少、砝码压置的时问保持一致,以保证样品装载的紧密 方法对烟草样品的近红外漫反射光谱进行了预处理,并用偏 最小二乘法来计算烟草样品的总氮含量。小波变换滤波后, 预测集的相对标准偏差由原光谱的9.2%降为7.4%,同时其 处理结果也优于傅立叶变换和五点三次平滑法[ J。 练文柳等采用基线校正、去卷枳、一阶微分、二阶微分、 主成分回归法(PCR)和偏最小二乘法(PLs)对198个烟叶样 度和厚度相同_1 。李军会等对样品分别在不重装一压样、 不重装一不压样、重装一不压样、重装一压样等情况下的重 复测量6次,结果发现,通过压样措施可以降低由样品松紧 度产生的误差,但其幅度是非常有限的llo]。 另外,改善装样均匀性是提高近红外分析准确性的一个 重要因素。对样品漫反射光谱进行采集时,主要是得到浅层 样品的信息。若装样不均匀,深浅层样品的理化性质有差 异,近红外漫反射预测得到的某种成分数据就不能够代表整 个样品中该种成分的真实值_l2_。为了减小样品的不均匀性 给分析结果带来的影响,装样时要将样品充分摇匀,结块样 品一定要捻成粉末。何智慧等的研究也表明,采用旋转样品 池比采用固定样品池采集光谱可以得到更多的样品信息,可 品的近红外光谱和总糖、还原糖、总烟碱含量数据进行了处 理,建立了相应的总糖、还原糖和总烟碱校正模型,并将这些 模型的回归参数作了比较。结果表明:二阶微分处理光谱 建立的模型的相关系数比基线校正、去卷枳、一阶微分预处 理法建立的模型的高,而其相对偏差比基线校正去卷枳、一 阶微分法的低 15。 3.2扫描参数设置的影响样品光谱采集时的光谱范围、 光谱分辨率和扫描次数等参数的设置情况也都会不同程度 地影响近红外光谱分析的结果。其中,光谱扫描范围的设置 以减少装样不均匀带来的影响,因此所建立的模型精度 较高_ll_。 2试验因素对分析结果的影响 直接影响光谱中所包含信息量的多少。扫描范围设置越广, 扫描一个样品所花费的时间就越长,但为了能最大程度地获 得样品中所包含的信息,一般都将光谱采集范围设置为仪器 所能采集的最大范围,以便在建模优化过程中有较大的删减 和取舍余地。 2.1基础数据准确性近红外光谱分析是一种间接分析技 术,要通过校正模型的建立来实现对未知样本的定性或定量 分析。因此,基础数据的准确性是影响近红外光谱分析结果 的一个重要因素,基础数据越准确,所建立模型的精度越高, 马翔等应用傅立叶近红外技术建立快速定量分析烟草 化学成分的数学模型,使用Bruker Optics公司的MPA型傅立 维普资讯 http://www.cqvip.com
36卷21期 张灵帅等烟草近红外光谱分析结果影响因素综述 叶变换近红外光谱仪(谱区扫描范围为12 000~4 000 cm ), 外光谱的非线性模型。该算法把PLS和ANN结合在一起,把 模型分成2个部分:线性部分与非线性部分。线性部分采用 偏PLS算法建立模型,PLS校正后剩余的残差作为非线性部 分。非线性部分利用PLS模型的主成分得分矩阵作为神经 网络的输入变量,残差作为目标向量,进行非线性校正 J。 笔者利用混合算法结合近红外光谱来预测烟草样品的总糖 含量,结果表明,该混合算法优于传统的PLS、PCR以及非线 性PLS。 4结语 选择不同的谱区范围对烟碱、总糖和总氮3种组分的数学模 型进行优化,结果显示,不同谱区范围对同一组分数学模型 的影响有明显的差异,而且不同组分所选择的最佳建模谱区 范围是不一样的_1 。这说明在模型优化过程中选择最佳谱 区范围是非常关键的。 同时,选择合适的分辨率也是获得高质量光谱(好的信 噪比和丰富的信息)的重要条件。通常情况下,较高光谱分 辨率往往会得到较丰富的光谱信息,但高光谱分辨率会导致 采集光谱的时间延长,还会增加光谱噪音ll 。段焰青等研 究了2、4、8、l6、32、64 cm- 几种不同的分辨率对烟叶烟碱预 测模型的影响,结果表明,高分辨率扫描样品所建立的模型 在各评价指标上均比低分辨率扫描所建的模型好,预测准确 性高,但综合考虑扫描时间和光谱图文件大小等因素,以分 辨率为8 cm7 扫描的光谱最能满足实际建模的需要_8J。 另外,增加样品扫描次数也是提高光谱信噪比的一种有 效方法,特别是对于均匀性较差的样品。通过旋转样品杯进 近红外光谱分析技术经过40多年的发展,硬件部分和 软件部分不断完善,已经成为一项比较成熟的分析技术,其 在烟草行业的应用范围越来越广。但在烟草近红外光谱分 析中,为了获得可靠的分析结果,除了选择有代表性的样品 外,同时应该考虑样品粒径、含水率及化学分析误差、仪器环 境的影响。进行光谱数据处理与分析时,还应该根据实际情 况选择合适的光谱预处理和数学建模算法,以取得最优的分 析结果。 参考文献 [1]王保兴,陈国辉,汪旭,等.近红外光谱技术在烟草领域的应用进展 [J].光谱实验室,2006,23(5):1075—1084. [2]陆婉珍,袁洪福,徐广通.等.现代近红外光谱分析技术[M].北京:中国 石化出版社,2000. [3]苏明亮,梁俐俐,吴正举,等.烟叶近红外分产地模型与总模型对比分 析[c]//中国烟草学会2006年学术年会论文集.2007. [4]KENNARDRW,s砌NELA.Computer aided design of experiments[J].Teeh— nometrics,1969,11:137—148. 行多次扫描取平均光谱来提高光谱的真实代表性,是目前分 析烟草粉末样品较常用的一种方法。但扫描次数并不是越 多越好。一方面,随着扫描次数的增加,扫描一个样品所花 的时间会延长;另一方面,通过扫描次数的增加来消除噪音, 只是在次数较低时作用明显,次数越多噪音衰减的程度越不 明显。因此,分析过程中扫描次数的设定应以提高信噪比和 满足扫描速度为准则。 3.3数学建模算法的影响建模时数学方法的选择也是影 响近红外分析的一个重要因素,建模时可以据不同模型的特 点和测量要求决定采用不同的数学方法。近红外光谱分析 中常用的计量学方法有:多元线性回归法(M】 )、主成分回 归法(PCR)、偏最/b---乘法(PLS)及人工神经网络法(ANN)。 由于各种算法都有其优缺点,目前许多人开始探索组合算法 的应用,如将PCR与ANN结合u 8¨:先利用PCR方法计算出 样品光谱的主成分,主成分数目通过交叉验证(、Cross。Valida。 tion)确定,再将其作为ANN的输入节点建立定量或定性模 [5]吴静珠,王一鸣,张/J、超,等.近红外光谱分析中定标集样品挑选方法 研究[J].农业棚械学报,2006,37(4):80—82. [6]李彦周,闵顺耕,刘霞.主成分分析在近红外定量分析校正集样本优选 中的应用[J].分析化学研究简报,2007,35(9):1331—1334. [7]赵丽丽,赵龙莲,李军会,等.傅立叶变换近红外光谱仪扫描条件对数 学模型预测精度的影响[J].光谱学与光谱分析,2004,24(1):41—44. [8]段焰青,周红,王明锋,等.粒度对烟末总糖、总氮和烟碱含量NIR预测 值的影响[J].烟草科技,2oo5(7):22—23,40. [9]段焰青,周红,李青青,等.烟样水分质量分数对其常规化学成分近红 外测定的影响[J].云南大学学报:自然科学版,2005,27(5):424—428. [1O]李军会,秦西云,张文娟,等.样品装样、测试条件等因素对近红外检 测结果的影响与分析误差源比较研究[J].光谱学与光谱分析,2007, 7(9):12751—1753. 。 型。这样既充分利用了全光谱的数据,又减少了ANN的输 入节点数和训练时间。 张玲分析认为,当测量波长点数少时,MLR还是相当有 [11]何智慧,练文柳,陈亚,等.光谱采集方式对AOTF-近红外光谱技术分 析烟草主要化学成分的影响[J].分析试验室,2005,4(26):4—228. [12]严衍禄.近红外光谱分析基础与应用[M].北京:中国轻工业出版社, 2005:81.2 [13]褚小立,袁洪福,陆婉珍.基础数据准确性对近红外光谱分析结果的 影响[J].光谱学与光谱分析,2005,25(6):886—889. [14]闵顺耕,谢秀娟,周学秋,等.近红外漫反射光谱的小波变换滤波[J]. 分析化学研究简报,1998,26(1):4—337. [15]练文柳,吴名剑 贤军,等.不同预处理方法对烟草近红外光谱预测 模型的影响[J].烟草科技,2O晒(2):19—23. [16]谢丽娟,刘东红,张宇环,等.分辨率对近红外光谱和定量分析的影响 研究[J].光谱学与光谱分析,2007,7(28):1489—1492. [17]马翔,王毅,温亚东,等.vr- ̄m光谱仪测定烟草化学成分不同谱区范 围对数学模型影响的研究[J].光谱学与光谱分析,2004,4(24):4 — 446. 效的,但当测量波长点数多时,MLR相当复杂。对于光谱重 叠严重的体系,MLR就为力了。波长点数越多,越能显 示出PLS算法的优越性。比较而言,近红外光谱仪采用PLS 定标回归方法更适宜[19J。 练文柳等研究了不同预处理方法对烟草近红外预测模 型的影响,并且用PLS和PCR 2种回归方法建立了定量分析 模型,从模型的各种参数比较可知,PLS算法要比PCR算法 要好[15]。 陈达等则针对烟草样品的近红外(NIR)光谱与其总糖含 量非线性相关的特点,提出了一种混合算法,用于建立近红 [18]吉海彦,严衍录.主成分一人工神经网络在近红外光谱定量分析中的 应用[J].分析测试学报,1999,18(3):12—14. [19]张玲.PIS定标法在近红外光谱分析仪中的应用研究[J].光学精密工 程,2000,8(3):238—241. [20]陈达,王芳,邵学广,等.近红外光谱与烟草样品总糖含量的非线陛模 型研究[J].光谱学与光谱分析,2004,24(6):672—674.
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- sceh.cn 版权所有 湘ICP备2023017654号-4
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务