老哥学习网 - www.lg9.cn 2024年05月21日 00:39 星期二
当前位置 首页 >公文范文 > 公文大全 >

基于高分六号数据提取太湖蓝藻方法的对比及适用性分析*

发布时间:2023-06-15 12:50:09 浏览数:

潘 鑫,杨 子,杨英宝**,孙怡璇,刘苏仪,谢文英,李藤藤

(1:河海大学地球科学与工程学院,南京 211100) (2:河海大学江苏省水资源环境遥感监测评估工程研究中心,南京 211100)

近年来太湖蓝藻暴发加剧,因此探究蓝藻的提取方法对太湖的水资源保护具有重要意义. 但目前大多采用国外卫星数据对太湖蓝藻进行提取,采用国内高分系列卫星数据研究较少,因此本文展开基于高分六号卫星数据对太藻提取的方法探究和适用性分析.

基于国外卫星数据对太湖蓝藻提取的研究中,王琳等[1-5]都采用Landsat系列卫星影像,分别运用指数阈值法、决策树模型、RF模型、单波段阈值法和支持向量机对太湖蓝藻进行提取,取得了较好的结果. 王萌[6]以太湖为研究区,采用新一代静止气象卫星Himawari-8,对太湖蓝藻进行连续的监测,估算了蓝藻水华的强度变化. 尹斌[7]基于MERIS数据,以太湖为研究区,建立叶绿素a浓度和藻蓝蛋白色素浓度遥感定量估算方法, 结果表明叶绿素a浓度与藻蓝蛋白色素浓度的比值与蓝藻暴发有着显著的关联. 汪雨豪等[8-10]分别基于哨兵2A、3A遥感影像数据,以太湖为研究区,分别采用藻华像元生长算法、最大叶绿素指数法和RF法对太湖蓝藻进行提取,均取得了不错的效果. Hu等[11-15]都以MODIS为数据源,分别采用植被指数阈值法和FAI指数对太湖蓝藻进行提取,结果表明植被指数和FAI指数都能够很好地提取太湖蓝藻. Qi等[16-17]以太湖为研究区,基于GOCI数据分别采用NDVI指数和调整的浮游藻类指数(AFAI)对太湖蓝藻进行监测,发现其GOCI卫星能更好地监测太湖蓝藻一天的变化.

基于国内高分系列卫星数据对蓝藻提取的研究中,潘鑫[18]采用高分六号数据,运用波段比值法、归一化差异叶绿素指数法和三波段法对太湖叶绿素a浓度进行反演,结果表明归一化差异叶绿素指数法能更好地反映太湖叶绿素a浓度,为进一步的蓝藻提取提供了科学支撑. 佴兆骏等[19-20]利用高分一号卫星数据, 采用归一化植被指数阈值法对太湖蓝藻提取,获得了较好的结果. Zhang等[21-22]都采用高分一号卫星数据,运用植被指数阈值法分别对星云湖和黄海的蓝藻进行提取,获得良好的效果. Zhang等[23]采用高分一号卫星数据与Landsat卫星进行融合生成一个高时间分辨率、高精度的数据集来预测太湖的蓝藻,取得较好的成果. 张海龙[24]和Zheng[25]都采用高分一号数据,运用多光谱绿潮指数法分别对江苏省近海区域和黄河进行绿潮的监测,取得不错的结果.

根据目前对太湖蓝藻提取的研究现状,阈值法计算简单适用性强,但阈值的准确选取是个难点. 机器学习法可以结合更多蓝藻的特征来对蓝藻进行分类,分类的精度相对较高,但分类结果受训练样本和输入变量的影响. 而通过建立经验模型的方法去预测蓝藻的暴发,其误差相比于其他方法较大. 考虑到对太湖蓝藻的提取还并未涉及采用高分六号卫星作为数据源,因此本文基于我国首颗具有红边波段的高分六号卫星遥感影像,采用RF法、归一化植被指数阈值法和多光谱绿潮指数阈值法对太湖蓝藻进行提取,以寻找适合高分六号卫星数据对太湖蓝藻提取的方法. 在此基础上采用不同遥感指数或波段组合的RF法探讨了基于高分六号数据提取蓝藻方法的适用性.

1.1 研究区概况

太湖(30°55′40″~31°32′58″N,119°52′32″~120°36′10″E)总面积为2427.8 km2,水域面积为2338.1 km2,湖岸线全长393.2 km,是我国第二大淡水湖[26]. 太湖属于亚热带季风气候,年均温度为17℃, 年降水量为1100~1150 mm. 太湖平均年出湖径流量为75×108m3,蓄水量为44×108m3. 但从2000年来,太湖蓝藻富营养化问题逐渐严重,给当地居民的饮水带来了巨大的挑战[27].

1.2 遥感数据

高分六号卫星是我国高分专项系列中发射的第一颗具有红边波段的卫星[28]. 作为我国的中高分辨率卫星,高分六号卫星搭载了2 m全色和16 m多光谱宽幅相机WFV(wide filed view). 高分六号卫星除了有红、绿、蓝、近红4个常见的波段,还新增了更有利于监测植被叶绿素浓度的两个红边波段,以及紫外和黄波段[29]. 高分六号波段详细信息见表1.

表1 高分六号数据的波段信息

本文采用的是高分六号WFV传感器获得的L1A级2019年4月6日、6月3日的遥感影像. 遥感影像的预处理分为两步——辐射校正和大气校正. 由于地物自身的反射率要通过大气和大气层才能到达卫星传感器,其辐射校正是为了将传感器中记录的灰度值(digital number,DN)转化为大气层表观反射率,得到的是未消除大气粒子影响的地物反射率值. 大气校正则是消除地物反射率在大气传播过程中受到的粒子和气溶胶的影响,而获得真实的地表反射率值. 本文影像大气校正采用的是FLAASH大气校正的方法. 本文采用高分六号数据是为了探究最适用于高分六号卫星提取太湖蓝藻的方法.

2.1 阈值法

2.1.1 归一化植被指数阈值法 归一化植被指数(normalized differential vegetation index,NDVI)法是应用最为广泛的植被指数,其公式如下:

(1)

式中,ρRed、ρNir分别代表的是红、近红波段的反射率. 根据NDVI指数的波段要求,高分六号卫星选择第3波段和第4波段进行NDVI指数的计算,哨兵二号选用第4波段和第8波段对NDVI指数进行计算. MODIS数据选用第1波段和第2波段对NDVI指数进行计算. 2019年4月6日和2019年6月3日的NDVI阈值分别为-0.075和0.18.

2.1.2 多光谱绿潮指数阈值法 张海龙等[24]提出的多光谱绿潮指数(multispectral green tide index,MGTI)能够较好地监测海洋中绿潮的变化,其公式如下:

(2)

式中,ρRed、ρGreen、ρBlue分别代表红、绿、蓝波段的反射率,λRed、λGreen、λBlue分别代表红、绿、蓝波段的中心波长. 阈值是通过目视解译的方法选取,2019年4月6日和2019年6月3日的MGTI阈值分别为0.015和0.039.

2.2 RF法

RF(random forest, RF)是一种特殊的套袋算法,是由Breiman[30]提出的一种可以进行分类或回归的算法. RF可以将训练集划分为若干新的训练集,每个新的训练集可以构造一个决策树模型,每个模型之间没有相关性,并持续分裂,直到该节点的所有训练样本都属于同一类型,然后将这些模型的结果进行整合,得到最终的结果. RF方法与原始的套袋算法的不同之处在于它使用决策树作为模型,本文采用RF分类算法.

2.2.1 RF的输入变量 归一化水体指数(normalized differential water index,NDWI)能够较好地识别水体,调整的浮游藻类指数(adjusted floating algae index,AFAI)能够很好地监测蓝藻水华的变化. 其公式如下:

首先,信息生产的不透明,是 AI 呈现出来的关键弊端,新闻来源和制作过程并不能为公众所查阅,而区块链可以真正达到信息的透明化,这对于新闻真实环境的建构是一个重大的突破。“AI+区块链”的最大意义就在于,区块链技术为人工智能提供核心技能—区块链技术的“链”功能,让人工智能的每一步“自主”运行和发展都得到完全记录和公开,从而促进人工智能技术运作的健全、安全和稳定。

(3)

(4)

式中,ρRed、ρNir、ρRe2分别代表红、近红和红边2波段的反射率,λRe2、λRed分别代表红边2和红波段的中心波长,ρNir、ρGreen分别代表近红和绿波段的反射率.

2.2.2 RF模型的建立 由于太湖基本上是由水体和蓝藻两部分组成,所以为了更精准地获取蓝藻,本文采用基于多遥感指数的RF方法,将不同指数和波段的组合,共三组作为输入数据来建立模型,分类结果作为输出数据. 由近红、红和绿波段合成的假彩色影像作为参考,通过目视解译的方式均匀选取900个样本点,其中蓝藻和水体样点各450个. 其中600个样本点(300个蓝藻样点和300个水体样点)作为RF的训练数据,剩余300个样点(150个蓝藻样点和150个水体样点)作为验证数据. RF分类过程中涉及的两个参数分别为ntree和mtry. 其中mtry为特征的数量值,也就是每个树节点的数量,设置为2,ntree是决策树的数量, 设置为1000[31].

RF模型的建立公式如下:

Model=RF_train(Index,Value)

(5)

Result=RF_class(Index,Value)

(6)

Model是RF建立的模型,Index作为RF的输入变量的数据集,Value为分类结果隶属的代表数值,Result是RF的分类结果. RF法3组不同输入变量的详情见表2.

2.3 精度评价指标

为了评定NDVI法、MGTI法和RF(NDVI&NDWI)法提取蓝藻的准确性,通过引入混淆矩阵来计算总体分类精度、Kappa系数、生产者精度、用户精度、错分误差和漏分误差[32-33]6种指标来对提取的结果进行评定. 混淆矩阵采用4个参数表示分别为True Postive(TP)、False Postive(FP)、True Negative(TN)和False Negative(FN).TP代表的是实际为水华像元且检测结果也显示为水华像元的像元数;
FP代表的是实际为水体像元但检测结果显示为水华像元的像元数;
TN代表的是实际为水体像元检测结果显示也为水体像元的像元数;
FN代表的是实际为水华像元但检测结果显示为水体像元的像元. 总体分类精度、Kappa系数、生产者精度、用户精度、错分误差和漏分误差的公式如下:

(7)

(8)

(9)

(10)

(11)

(12)

(13)

式中,po为总体分类精度,p1为过程变量,K为Kappa系数,pp为生产者精度,pu为用户精度,pe为错分误差,pm为漏分误差.

2.4 蓝藻水华的分级方法

基于NDVI阈值法采用等间隔分级的方法对不同程度的蓝藻水华进行划分[34],其中2019年4月6日影像的NDVI阈值为-0.075,则将此期影像不同程度的蓝藻水华分为3级:轻度蓝藻(-0.0750.225). 同理2019年6月3日的影像可将不同程度的蓝藻水华分为3级:轻度蓝藻(0.180.54).

3.1 结果

根据刘聚涛等对蓝藻暴发期的划分[35], 本文选取2019年4月6日和2019年6月3日的高分六号数据分别作为小型蓝藻暴发期和中型蓝藻暴发期的研究影像,并采用NDVI法、MGTI法和RF(NDVI&NDWI)法对太湖蓝藻进行提取及对比分析,同时采用晁明灿等[34]对蓝藻分级的方法,将两期提取蓝藻的结果进行分级(图1).

图1 两期太湖蓝藻的分级结果Fig.1 The results of two cyanobacteria classification in Lake Taihu

图2 基于高分六号采用3种方法的提取结果(2019年4月6日)Fig.2 Extraction results based on GF-6 using three methods(April 6, 2019)

图3 基于高分六号数据局部提取蓝藻的结果(2019年4月6日)Fig.3 Local results of extracting cyanobacteria based on GF-6 data(April 6, 2019)

如图4所示,从2019年6月3日的影像整体上看,中度蓝藻多聚集在竺山湖、太湖南部近岸和梅梁湖部分区域. 轻度蓝藻多漂浮在湖心区域. RF(NDVI&NDWI)法和MGTI法相比于NDVI法能更完整地将轻度蓝藻提取出,但NDVI法相比于MGTI法在识别中、重度蓝藻略胜一筹. 在竺山湖区域,MGTI法明显将大多数的蓝藻漏提.

图4 太湖蓝藻重度暴发期的提取结果(2019年6月3日)Fig.4 Extraction results of the floating algae outbreak in Lake Taihu (June 3, 2019)

3.2 验证

在不同类型蓝藻暴发时期,基于高分六号数据提取蓝藻的不同方法的精度评定见表3,在中型蓝藻暴发期RF(NDVI&NDWI)法的总体分类精度和Kappa系数都最高,分别达到99%和0.97,RF(NDVI&NDWI)法在小型蓝藻暴发期提取蓝藻的精度也是最高的. 精度次之的是MGTI法,在两个暴发期的总体分类精度都超过80%,NDVI法的精度是3种方法中最低的,但和MGTI法的总体差别不大. 生产者精度直接影响着蓝藻提取的完整性,3种方法的生产者精度都超过了0.95,说明这3种方法可以全面的提取蓝藻信息,其漏分误差也能反映这一点(表3). 用户精度的高低反映了提取结果中多少像元是真实的蓝藻信息,RF(NDVI&NDWI)法的用户精度高,两个不同蓝藻暴发期都超过了0.95. 总得来说,基于高分六号卫星数据采用RF(NDVI&NDWI)法提取蓝藻的效果更好.

表3 不同蓝藻暴发时期基于高分六号数据采用不同方法提取蓝藻的精度评价

4.1 RF不同输入变量对蓝藻提取结果的影响

RF法的输入变量不同,提取蓝藻的结果也会有差异. 为了探讨RF不同输入变量对蓝藻提取结果的影响,本文采用2019年4月6日的高分六号影像,将上述3组训练数据集分别作为RF的输入变量来进行对比分析.

如图5所示,可以看出3种不同输入变量组合的RF法提取蓝藻的结果基本一致,在梅梁湖有蓝藻覆盖的区域,RF(NDVI&NDWI)法和RF(RED&NIR&NDWI)法将此部分的蓝藻提取了出来,但在贡湖这两种方法将水生植被误分为蓝藻. 但在太湖湖心东部轻度蓝藻区域,RF(RED&NIR&NDWI)法识别能力不如RF(NDVI&NDWI)法. RF(AFAI&NDWI)法将湖心东部及太湖南岸的轻度蓝藻提取了出来,但未识别梅梁湖的中、重度蓝藻.

图5 基于高分六号采用3种不同RF方法的提取结果(2019年4月6日)Fig.5 Extraction results based on GF-6 using three different random forest methods(April 6, 2019)

对3种RF方法的精度评定表明,RF(NDVI&NDWI)法提取蓝藻的精度更高,总分类精度和Kappa系数分别为94%和0.88(表4). 3种RF法的生产者精度都超过了0.95,漏分误差也随之未超过0.04. 证明RF法不同输入变量对蓝藻提取结果具有一定的影响,类似的影响也在其他区域蓝藻提取研究中被发现[36-39].

表4 基于高分六号数据采用不同输入变量RF方法提取蓝藻的精度评价

4.2 本文方法的优缺点

对于蓝藻的提取,传统的阈值法需要基于大量的影像做基础来确定阈值,晁明灿等[34]、张东彦[40]、Hu[11]等以中国的湖泊为研究区,采用大量的遥感影像来确定FAI指数的阈值. RF法相对于阈值法来说省时省力,但RF法的精度和选择的样本数有很大的关系,其样本数目太少或者不均匀都会对结果造成一定程度的影响[41-42]. 在刘云翔等[43]建立随机森林水华预警模型的研究中,也指出RF输入变量的样本选取决定结果的准确性. 同时侍昊等[3]在采用RF法进行太湖水生植被的提取时强调其样本的选取一定要均匀且分类明确.

以太湖为研究区,基于高分六号数据,对NDVI法、MGTI法和RF法3种提取蓝藻水华的方法进行对比分析,并对基于不同输入变量的RF法进行探讨,得出以下结论:

1)探究适用于高分六号数据的太湖蓝藻提取方法中,本文采用RF法、NDVI法和MGTI法对太湖蓝藻的提取结果进行对比分析,NDVI法具有明显漏提蓝藻的现象,MGTI法对太湖蓝藻识别的效果整体较差. RF法相对来说可以较完整地提取蓝藻,尤其是在中型蓝藻暴发期,采用RF(NDVI&NDWI)法提取蓝藻的总体分类精度和Kappa系数也是最高的,故是最适用于高分六号数据对太湖蓝藻提取的方法.

2)探讨基于高分六号RF不同输入变量的适用性,结果表明3种RF法都较为完整地提取出蓝藻,但RF(NDVI&NDWI)法和RF(RED&NIR&NDWI)法将贡湖的部分水生植物误分为蓝藻,其中RF(RED&NIR&NDWI)法对湖心轻度蓝藻识别能力最弱. RF(AFAI&NDWI)法虽未将水生植被误分为蓝藻,但明显将部分中、重度蓝藻漏提. 相比于其他2种RF法,采用RF(NDVI&NDWI)法的总体分类精度和Kappa系数最高,分别为94%和0.88,故是最适用于提取太湖蓝藻的RF法.

猜你喜欢 蓝藻太湖波段 《太湖冬景》湖州师范学院学报(2022年9期)2022-11-09太湖茭白华人时刊(2022年13期)2022-10-27最佳波段组合的典型地物信息提取航天返回与遥感(2022年2期)2022-05-12南美白对虾养殖池塘蓝藻水华处理举措当代水产(2019年8期)2019-10-12南美白对虾养殖池塘蓝藻水华处理举措当代水产(2019年9期)2019-10-08针对八月高温蓝藻爆发的有效处理方案当代水产(2018年8期)2018-11-02太湖三白动漫星空(兴趣百科)(2018年11期)2018-10-29基于PLL的Ku波段频率源设计与测试电子制作(2018年2期)2018-04-18小型化Ka波段65W脉冲功放模块制导与引信(2017年3期)2017-11-02L波段kw级固态功放测试技术电子制作(2017年8期)2017-06-05

推荐访问:太湖 蓝藻 适用性

相关文章:

Top