当前位置: >首页 >学会概况 >省级学会 >河北省测绘学会
河北创新测绘技术应用——基于多源遥感数据与机器学习算法的冬小麦产量估算研究
发布时间:2025-05-06     来源:河北省测绘学会     作者:张永彬、李想、满卫东等      浏览:3213次

前沿:河北省测绘学会策划“创新测绘技术应用”专题栏目,聚焦测绘科技应用前沿。本栏目将展示测绘与AI、遥感等融合的创新实践,涵盖气象监测、生态保护、地理信息服务、农作物估产及文化遗产保护等领域。通过案例剖析,探讨测绘技术如何助力社会管理与可持续发展。基于多源遥感数据与机器学习算法的冬小麦产量估算研究

针对光学影像容易受到云雨天气影响,导致农作物产量估算精度低的问题,本研究融合冬小麦孕穗期Sentinel-2光谱信息和Sentinel-1后向散射系数,并采用极端梯度提升、随机森林和支持向量机3种机器学习回归方法建立唐山市冬小麦产量估算模型,选用最佳模型实现唐山市冬小麦产量反演。结果表明:基于植被指数和后向散射系数的极端梯度提升模型的估产效果最好,决定系数(R2)为0.654,均方根误差(RMSE)为0.499 t•hm-2,归一化均方根误差(nRMSE)为10.02%;24个遥感特征变量中,NDMI、NDVIre3和NDVIre2的重要性远高于后向散射系数;基于最佳估产模型反演唐山市冬小麦产量空间分布,冬小麦产量范围主要集中在7.00~8.00 t•hm-2,所占比例达到40.75%,冬小麦产量分布总体上与地面真实情况相近。本研究提出Sentinel-1/2数据和机器学习算法相融合的冬小麦产量估算方法,有效提高了机器学习方法反演冬小麦产量的准确性,并加强了模型的解释性,该方法具有一定可行性。

利用遥感技术进行区域作物产量估算,已经成为农作物估产的新手段。传统的抽样调查、实地观测等估产方法不适用于大区域农作物估产,且耗时耗力无法满足实际需求。遥感具有覆盖范围广、重复周期短和较容易获得的优点,在农作物产量估算中得到了广泛应用。冬小麦作为中国主要粮食作物之一,利用粮食遥感估产技术准确估算冬小麦产量,对粮食生产管理和保障粮食安全具有重要意义。

随着卫星传感器的发展,卫星影像逐渐向高质量高时空分辨率方向发展,为区域农作物产量精确估算提供了数据基础,如欧洲航天局的Sentinel-1合成孔径雷达(SAR)影像、Sentinel-2多光谱影像等。遥感卫星接收的光谱信息和后向散射系数可以完全反映农作物的生长状态。遥感估产的方法主要是经验统计模型,利用从影像中提取的相关遥感指标建立与作物产量的回归关系,从而估算作物产量。前人基于遥感技术多采用线性回归的方法研究农作物产量。农田系统结构复杂多变,绝大多数农作物生长过程通常表现为非线性过程,单一遥感指标并不能够完全反映其生长状态。随着机器学习技术的发展,极端梯度提升、随机森林、支持向量机等非线性模型在作物产量估算领域表现出色,许多学者应用非线性模型开展了农作物产量估算研究。

目前,农作物估产主要以多光谱低空间分辨率影像(Landsat 和 MODIS 等)为主,针对 Sentinel-1 SAR 数据与Sentinel-2 多光谱数据应用于冬小麦估产的相关研究较少,并且主要为单一数据类型的线性回归模型。本文基于Sentinel-1/2 卫星影像数据,结合唐山市田间冬小麦产量数据,利用构建的植被指数数据(包括红边植被指数)和后向散射系数,对比分析极端梯度提升模型、随机森林模型和支持向量机模型的估产精度,进而实现冬小麦产量大区域、高精度反演,为粮食遥感估产研究提供参考。

研究区概况

唐山市位于河北省东部、华北平原东北部,介于117°31′E~119°19′E,38°55′N~40°28′N。截至2020年10月,唐山市下辖7个市辖区、3个县级市、4个县;南临渤海,北依燕山,地势北高南低,平均海拔90 m,全市土地总面积为143.4万hm2,耕地面积为56.71万hm2。气候属暖温带半湿润大陆型季风型气候,年平均气温12℃左右,年平均降水量500~700mm。冬小麦是唐山市主要粮食作物之一,每年10月初寒露前后进入播种期,次年6月初到达成熟期,生育期230~260d。

数据获取与预处理

冬小麦成熟期,收割具有代表性的1 m2的冬小麦,对冬小麦进行脱粒、晒干、质量称重,得到样点的冬小麦产量数据。

冬小麦遥感估产的前提是需要识别冬小麦空间分布。以Sentinel-2数据为基础数据,构建归一化植被指数、差值植被指数、比值植被指数等植被指数,根据植被生长的物候特征,建立面向对象-随机森林方法的冬小麦种植面积提取模型,得到冬小麦的空间分布结果,总体分类精度大于85%。

Sentinel-1是一颗载有C波段合成孔径雷达,Sentinel-2卫星多光谱数据包含13个光谱波段,从可见光和近红外到短波红外,具有独特的光谱功能,拥有不同的空间分辨率,将卫星影像空间分辨率重采样到20 m×20 m。研究选择前人在农作物产量估算中常用的12种植被指数的基础上,充分利用Sentinel-2卫星的光谱反射率信息,将绿色叶绿素指数和归一化植被指数的可见光波段替换为红边波段,建立红边植被指数。同时,提取Sentinel-1卫星的VV和VH两种极化方式对应的后向散射系数,并计算4种后向散射系数组合参数:差值(VH-VV)、求和(VH+VV)、乘积(VH*VV)和求商(VH/VV)。

数据分析方法

产量估算方法选用极端梯度提升模型(XGBoost)、随机森林回归、支持向量机回归。XGBoost模型可以拟合因变量和自变量之间复杂的非线性关系,同时对于变量类型具有很高的宽容度,通过在训练过程中计算各个特征变量在树的构建过程中被使用的次数或被用于分裂的增益值(Gain)来确定特征的重要性值,用于评价特征变量对预测结果的贡献度。不同特征变量组合方式:A组合包含植被指数和后向散射系数,B组合包含植被指数,C组合包含后向散射系数。

研究结果

1 模型综合评价

三种机器学习估产模型相比较,XGBoost模型的估算结果最好,其次是RFR模型,最后是SVR模型(下表所示)。A组合的XGBoost模型估算结果表现最好,其R2为0.654,RMSE为0.499 t•hm-2,nRMSE为10.02%。在XGBoost模型下,A组合所构建的模型估算效果优于B组合和C组合,估算误差RMSE分别降低0.014 t•hm-2和0.093 t•hm-2,模型R2分别提高0.022和0.115。后向散射系数参数和植被指数参数结合使用有助于提高XGBoost模型的估测精度。

图片表3 模型综合评价


图片

2 特征变量重要性排序

A组合的冬小麦估产模型中,前14个特征变量的累积重要性占所有变量的98.20%,贡献度最高的特征变量是NDMI,该变量利用短波红外波段和近红外波段建立的归一化差值水汽指数,其重要性值远高于其他特征变量的重要性值。其次重要的特征变量为NDVIre3和NDVIre2,分别表示B7和B6波段与近红外波段建立的红边归一化植被指数3和红边归一化植被指数2。Sentinel-1影像的后向散射系数参数在模型中也表现出较强的重要性,交叉极化VH后向散射系数比同级化VV后向散射系数在A组合中更有优势。

图片


图1 特征变量重要性排序

3 冬小麦产量空间分布

冬小麦产量范围主要集中在7.00~8.00 t•hm-2,所占比例达40.75%,主要分布在玉田县和丰润区,其他地区零散分布;其次在8.00~9.00 t•hm-2,所占比例达35.43%;冬小麦产量小于6.00 t•hm-2的区域分布较为集中,主要分布于玉田县南部和东部、丰润区中部,以及滦南县东部,少量零散分布于其他区域;冬小麦产量大于9.00 t•hm-2的区域主要分布在滦州市、滦南县和乐亭县。各地区冬小麦产量出现差异,可能与农户生产管理有关,不同地区的气候条件也可能导致不同的结果。

图片

图2 唐山市冬小麦产量分布

主管部门:
自然资源部
民政部
中国科协
京ICP备14037318号-1 京公网安备 11010802031220号
主办:中国测绘学会    技术支持 :江苏润溪时空智能科技股份有限公司
联系电话:010-63881345      邮箱地址:zgchxh1401@163.com
联系地址:北京市海淀区莲花池西路28号西裙楼四层