您好,欢迎来到尚车旅游网。
搜索
您的当前位置:首页利用机器学习的植被净初级生产力遥感估算方法[发明专利]

利用机器学习的植被净初级生产力遥感估算方法[发明专利]

来源:尚车旅游网
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 106372730 A(43)申请公布日 2017.02.01

(21)申请号 201610719136.7(22)申请日 2016.08.25

(71)申请人 三亚中科遥感研究所

地址 572029 海南省三亚市天涯镇黑土村6

号(72)发明人 于博 陈方 (51)Int.Cl.

G06N 99/00(2010.01)

权利要求书1页 说明书6页 附图2页

CN 106372730 A(54)发明名称

利用机器学习的植被净初级生产力遥感估算方法(57)摘要

本发明公开了一种基于多源遥感产品,通过机器学习构建植被净初级生产力(Net Primary Production,NPP)估算模型的方法,该方法针对

提出采用机器学习的海量数据产品的分析特点,

方法模拟和构建全球植被净初级生产力估算模型,同时基于该模型计算了各个相关特征产品在植被净初级生产力估算中的重要性。主要分四步:(1)收集NPP空间观测产品和NPP相关变量的空间观测产品;(2)数据归一化处理;(3)训练NPP估算模型;(4)评估各个因素在估算NPP模型中的重要性。该方法为利用多空间观测数据开展植被净初级生产力的估算提供了一种新思路。

CN 106372730 A

权 利 要 求 书

1/1页

1.一种基于多源遥感产品,通过机器学习构建植被净初级生产力(Net Primary Production,NPP)估算模型的方法,其特征在于,利用机器学习模型客观的学习NPP相关变量与NPP空间观测值之间存在的关系,再根据各个变量对估算得到的NPP值与该变量被替换为0时得到的NPP值之差衡量其对NPP估算过程中产生的影响大小,具体实施方案如下:

(1)收集NPP空间观测产品和NPP相关变量的空间观测产品

NPP空间观测产品主要采用MODIS(MOderate-resolution Imaging Spectroradiometer)卫星产品作为NPP的实际值,NPP相关变量的空间观测产品主要包括OMI(Ozone Monitoring Instrument)传感器提供的气溶胶指数,大气二氧化氮浓度以及紫外线辐照度;MODIS传感器提供的火灾辐射强度(FRP,Fire Radiative Power)、地表温度、湿度、土壤湿度、光谱植被指数和土地利用类型;AIRS(Atmospheric Infrared sounder)传感器提供的大气二氧化碳浓度;GES DISC(Goddard Earth Sciences Data and Information Services Center)平台提供的植被高度,土壤温度和净全波辐射(Net all-wave radiation)产品以及BP(英国石油公司)2015全球能源统计报告全球能源市场统计数据中的人类主要能源与可再生能源消耗量与二氧化碳排放量数据;

(2)数据归一化处理

将每景相关遥感产品值都归一化到0-1,避免不同变量产品的值因单位不同,差异较大;

(3)训练NPP估算模型

采用随机森林方法训练NPP估算模型,其中选取80%的数据为训练数据,其他数据为测试数据;

(4)评估各个特征变量在估算NPP模型中的重要性

基于训练好的模型计算每个特征变量对估算NPP的重要性,通过计算在各个特征变量值为零时随机森林模型的估算结果与正常训练后的模型得到的估算结果之间的差而得到。

2.如权利要求1所述的基于多源遥感产品,通过机器学习构建植被净初级生产力(Net Primary Production,NPP)估算模型的方法,其特征在于,收集28种与NPP计算相关的卫星产品与统计数据,所有相关数据都描述同一区域在同一时间段的产品。

3.如权利要求1所述的基于多源遥感产品,通过机器学习构建植被净初级生产力(Net Primary Production,NPP)估算模型的方法,其特征在于,采用随机森林方法训练NPP估算模型,其中随机森林方法是由多个决策树组成的模型,既可以用于分类,也可以用于逻辑回归;本申请利用随机森林训练估算NPP的逻辑回归模型,每棵树从输入数据中随机选取一定大小的数据集,计算得到一个回归值,得到每棵树的回归值后,对所有回归值取平均,作为随机森林模型的NPP估算值。

4.如权利要求1所述的基于多源遥感产品,通过机器学习构建植被净初级生产力(Net Primary Production,NPP)估算模型的方法,其特征在于,评估各个特征变量在估算NPP模型中的重要性,通过计算在该特征变量值为零时随机森林模型的估算结果与正常训练后的模型得到的估算结果之间的差而得。

2

CN 106372730 A

说 明 书

利用机器学习的植被净初级生产力遥感估算方法

1/6页

技术领域:[0001]本发明涉及机器学习技术领域,是一种基于多源遥感产品的植被净初级生产力估算模型。

背景技术:[0002]植被净初级生产力(Net Primary Production,NPP)是指在一定时间段内积累的有机物含量,而该有机物是光合作用产生的有机物在自养呼吸消耗后剩余的净有机物含量,是地球上大部分物种的直接或者间接的食物来源,以及调节生态过程的关键因素。NPP不但是表征生态系统对全球变化响应的主要因子,也是被用作辅助政府决策和衡量经济发展程度的重要指标。因此,全面准确地观测NPP对掌握生态系统质量状况和自然生产能力具有重要的科学和社会意义。[0003]在自然界中,生物地球化学循环通过直接影响大气层温室气体的浓度和太阳辐射的强度使陆地生态系统的生物地球化学过程发生显著变化,进而对NPP产生强烈影响。在对NPP的估算中,过程模型是目前主要的研究手段,如光学利用率模型和CASA模型(Carnegie-Ames-Stanford approach)等。这些模型不但可用于NPP估算,也可以分析温度、湿度等生态特征对NPP的影响。[0004]除了基于过程模型的方法外,多尺度的数据观测也是获取NPP的重要手段。NPP的实地观测主要依赖于观测站点上繁琐、持续的数据收集,而基于观测站点手段收集的NPP数据仅覆盖小范围地面,且站点的密集程度随地形地势变化起伏较大,无法直接用于大尺度范围的NPP准确观测,获取的站点数据也常难以共享。[0005]对地观测具有快速、宏观、准确地获取地球系统特征信息的特点,随着全球对地观测能力的提升,覆盖范围广、数据获取便捷、成本低廉、观测结果客观的遥感数据产品已经成为NPP估算的重要数据源之一。目前不但大量基于空间观测的植被指数、湿度、地表参数和土壤属性等卫星产品已被广泛用于NPP估算,同时不同空间分辨率、时间尺度的卫星遥感NPP产品也得到发布应用,为NPP的研究提供了便利。[0006]目前针对生态特征对NPP影响的研究多针对温度、湿度、植被指数、土地利用类型和二氧化碳气体浓度等参数,较少同时涵盖火灾、土壤湿度、土壤温度、植被高度、气溶胶指数等多个生态特征和大气气体浓度以及人类能源消耗等因素,且较少综合考虑每个特征对NPP估算的影响。[0007]机器学习,作为一种数据驱动模型,重在从数据中学习经验关系,其模型参数更加客观、准确。目前已有少量研究采用机器学习与遥感相结合的方法对总初级生产力(Gross Primary Productivity,GPP)进行估算。此研究表明基于遥感数据产品的机器学习研究不仅可以改进GPP的估算,还可以避免传统过程模型中网格构建的不确定性。[0008]本研究方法中的基于机器学习的NPP估算方法,将人类能源消耗、火灾强度、土地利用类型、土壤湿度、气溶胶光学厚度、地表温度等28种特征参量作为计算NPP的相关变量,并利用过程模型MODIS NPP的产品作为NPP的真值进行NPP估算模型的训练、验证和评估。同

3

CN 106372730 A

说 明 书

2/6页

时,基于训练好的模型,计算每一种特征参量在NPP估算中起的作用,客观地评价全球尺度NPP各相关变量的重要性。

发明内容:[0009]本发明的目的是针对目前NPP的主要估算模型存在的数据获取难度较大,受研究站点分布和研究人员的知识背景影响严重等缺陷,提供一种基于多源遥感数据,通过机器学习训练NPP估算模型的方法。该方法通过训练全球尺度的NPP估算模型,对复杂地形等研究站点很少分布的情况估算NPP。此外,基于训练的NPP估算模型,可以从数据客观的评估各个特征变量在NPP估算中发挥的作用,不仅为NPP估算提供了一种新思路,更为综合、全面、客观的理解NPP的影响因素提供了一种新方法。[0010]为达到上述目的,本发明的技术解决方案是:[0011]一种基于多源遥感产品构建植被净初级生产力估算模型的方法,其特征在于,该方法包括空间观测产品收集,数据预处理,模型训练和各个特征变量重要性评估,具体步骤操作如下:[0012]第一步:收集NPP空间观测产品和NPP相关变量的空间观测产品,具体产品如表1所示:[0013]表1.NPP相关遥感产品

4

CN 106372730 A

说 明 书

3/6页

[0014]

[0015][0016]

1.NPP空间观测产品

由于直接观测NPP比较困难,目前NPP的主要空间观测产品多通过过程模型结合相

5

CN 106372730 A

说 明 书

4/6页

应遥感数据来计算获取的。常用的观测产品主要是MODIS(MOderate-resolution Imaging Spectroradiometer)。MODIS的NPP产品是基于MOD17算法合成的全年1公里尺度产品。考虑到MODIS NPP产品已经经过大量验证,并广泛的应用于NPP的相关研究中,本文采用MODISNPP产品作为全球范围内NPP的真值。[0017]2.NPP相关变量的空间观测产品[0018]OMI(Ozone Monitoring Instrument)传感器数据可提供臭氧、二氧化氮、气溶胶以及其他大气参数产品,MODIS传感器数据主要包括土壤湿度、地表温度、植被指数、火灾强度以及土地利用类型等产品。这里主要以传感器的角度分别介绍NPP相关变量的空间观测产品。[0019]2.1OMI传感器相关产品[0020]本申请从基于OMI传感器的遥感数据产品中选取了气溶胶指数,大气二氧化氮浓度以及紫外线辐照度作为估算NPP的相关变量特征。其中气溶胶指数是计算光合有效辐射(PAR)的重要参数,而光合有效辐射是基于过程模型计算NPP的基本变量,因此其相应的遥感产品可以用来进行NPP估算。大气中的二氧化氮二级产品(L2)也可以用来估算NPP,因为其对植被的光合作用有一定的影响。紫外线辐照度与紫外线在臭氧层的损耗有关,而大量的研究表明大气层中的臭氧层与NPP之间有强烈影响,因此紫外线辐照度的遥感数据也可以作为估算NPP的相关产品。[0021]2.2MODIS传感器相关产品[0022]本申请选取基于MODIS传感器的火灾辐射强度(FRP,Fire Radiative Power)、地表温度、湿度、土壤湿度、光谱植被指数和土地利用类型作为计算NPP的相关变量特征。选取FRP是考虑到其通常被用来评估火灾对生态系统的影响,而火灾会导致周围土壤、大气和植被的变化,进而影响周围的生态系统及NPP变化。MODIS的地表温度产品包括白天地表温度和夜间地表温度,可以全面的衡量植被生长的土地温度环境。湿度是影响植被呼吸和光合作用的又一重要变量,MODIS湿度产品(GPCP,Global Precipitation Climatology Project)是基于6000多个雨水计量数据站的数据遥感估算得到的,土壤湿度可以评估植被生长的土壤状态,进而影响NPP的含量。此外,大量研究表明植被指数NDVI和EVI与生态环境有着强烈的关系,因此,它们作为植被生长状态的指示变量,对NPP的估算有着一定影响。[0023]2.3其他传感器产品以及数据源[0024]其他与NPP估算有关的遥感产品有大气二氧化碳浓度,植被高度,土壤温度和净全波辐射(Net all-wave radiation)等。大气二氧化碳浓度选取AIRS(Atmospheric Infrared sounder)2°x2.5°空间分辨率产品。植被高度是指与大气、温度、湿度和风速相作用的部分植被的高度,对NPP有一定影响,GES DISC(Goddard Earth Sciences Data and Information Services Center)平台提供其1°x1.25°空间分辨率的年尺度数据产品。土壤温度是衡量土壤表面以下水通量和可用能源的参数,对NPP影响较大,是通过LDAS(Land Data Assimilation Systems)模型计算得到的年尺度产品。净全波辐射用来衡量地球表面吸收的辐射,是NPP估算中常用的变量。此外,本申请还结合了BP 2015全球能源统计报告中全球能源市场统计数据,选取了人类主要能源与可再生能源消耗量与二氧化碳排放量数据。BP统计数据利用ArcGIS 10.1软件生成1°x1°分辨率的地图影像。[0025]第二步:数据归一化处理

6

CN 106372730 A[0026]

说 明 书

5/6页

计算每景相关遥感产品的最大、最小值,并将每景影像的像素值都归一化到0-1,

避免不同变量产品的值因单位不同,差异较大。

[0027]

其中,I是每景相关遥感产品影像,P(x,y)代表每个像素的值,max(I)和min(I)分别代表影像的最大和最小像素值,P(x,y)norm是归一化后像素P(x,y)的值。[0029]第三步:训练NPP估算模型[0030]采用随机森林方法训练NPP估算模型,选取80%的数据为训练数据,其他数据为测试数据。随机森林是由多个决策树组成的模型,既可以用于分类,也可以用于逻辑回归。本申请利用随机森林训练计算NPP的逻辑回归模型,每棵树从输入数据中随机选取一定大小的数据集,计算得到一个回归值。得到每棵树的回归值后,对所有回归值取平均,作为随机森林模型的NPP估算值。通过最小化NPP估算值与真实值之间的差,训练整个随机森林模型。[0031]第四步:评估各个因素在计算NPP模型中的重要性[0032]基于训练好的模型计算每个特征变量对估算NPP的重要性。通过计算在各个特征变量值被替换为零时随机森林模型的估算结果与正常训练后的模型得到的估算结果之间的差而得到。

附图说明:[0033]图1为本发明实施例提供的流程图。;[0034]图2为本发明实施例提供的2011年NPP基于随机森林模型的估算图;[0035]图3为本发明实施例提供的2011年MODIS NPP产品图;[0036]图4为本发明实施例提供的2011年MODIS和随机森林模型估算的NPP散点图及其相关系数;[0037]图5为本发明实施例提供的各个特征变量在NPP估算中的重要性。具体实施方式:[0038]下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行描述。显然,所描述的实施例仅是本申请的部分实施例,不是全部实例。[0039]本申请的实施例针对全球范围选取和收集了2005年到2011年间28个与NPP估算相关的全球尺度的空间观测遥感产品以及对应年份的BP全球能源消耗与二氧化碳排放统计数据。其中,所有相关遥感产品在美国国家航空航天局GES DISC网站生成和下载,并且被重采样为1°X1°的空间分辨率。BP统计数据利用ArcGIS 10.1软件生成1°X1°分辨率的地图影像。在利用随机森林训练NPP估算模型中,选取2005年-2010年的数据为训练数据,2011年的数据为测试数据。[0040]对比图2和图3,可以看到,随机森林模型可以较好的模拟估算NPP,计算得到的NPP与MODIS NPP产品的趋势非常相近。图3中MODIS的NPP产品中有很多数据缺失的琐碎斑点,而这些斑点在随机森林模拟的结果中被很好的克服,这一特点反映出随机森林在处理数据缺失情况下的优势。[0041]如图4所示,为了客观评价随机森林模拟估算的NPP相比MODIS NPP产品的精度,本

7

[0028]

CN 106372730 A

说 明 书

6/6页

申请计算了随机森林模拟的NPP与MODIS NPP的相关系数,表明随机森林模拟估算的NPP与MODIS的NPP产品呈现强相关关系,其相关系数达到0.913。此结果进一步验证了机器学习方法随机森林在模拟模型结构中的学习能力,其经过学习计算的NPP与过程模型得到的MODIS NPP产品结果一致,表明机器学习方法可以用来有效地进行NPP估算。[0042]如图5所示,基于训练好的模型,本申请依据表1中的序列号计算每个特征变量在NPP估算中的重要性。序列号为14,15和20的特征在NPP的估算中作用最大。这三个特征分别为NDVI、土地利用类型以及表面发射系数。NDVI描述植被的生长状态,在本NPP的计算中最为重要。地物类型也是影响NPP的主要因素,不同类型地物的NPP含量不相同,表面发射率衡量从物体发出的热辐射的有效性,对植物之间热传递影响较大。序列号为16、2和23的特征对NPP估算的影响次之,分别为紫外线辐照度,维度和风速。其中紫外线福照度和维度都影响太阳光的辐射强度,进而对NPP产量产生了较大影响,风速对植被的蒸腾作用和植被与大气环境的相互作用起较大影响。此外,人类活动导致的主要能源和再生能源消耗和二氧化碳排放量(序号为24-28的特征)对NPP的估算也有显著的影响。与多数基于过程模型的NPP估算研究不同的是,与植被生长状态、太阳能辐照强度以及人类活动相比,气溶胶光学厚度、土壤湿度、土壤温度、湿度以及地表温度等生态参数对NPP的影响并不显著,而这些参数正是构成多数过程模型的基本变量。这一结果表明过程模型关注的是NPP的形成机理,较多考虑模型设计结构,存在客观性和全面性限制的问题,而机器学习模型是从海量数据中学习模型结构,可以较客观全面地评价各个变量与NPP之间的关系。

8

CN 106372730 A

说 明 书 附 图

1/2页

图1

图2

图3

9

CN 106372730 A

说 明 书 附 图

2/2页

图4

图5

10

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- sceh.cn 版权所有 湘ICP备2023017654号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务