当前位置: >首页 >测绘智库 >智库观点
陈军院士等:基于可解释机器学习模型的区域生态安全模式优化
发布时间:2025-08-18     来源:     作者:学研录      浏览:101次

近日,陈军院士作为通讯作者,与西南交大、四川师范、四川省国土科研院等多家单位合作,在环境科学顶级期刊《Journal of Environmental Management》发表题为“Optimizing regional ecological security patterns based on interpretable machine learning models: A case study of Huzhou, Zhejiang Province”研究论文,基于可解释机器学习模型的区域生态安全格局优化 —— 以浙江省湖州市为例!

本项目得到了国家自然科学基金重大项目“智能测绘混合计算理论与方法研究”和自然资源部“构建中国三维写实地理空间景观模型总体设计计划”的支持。

亮点

  • 采用贝叶斯优化参数的CatBoost模型评估自然与社会经济指标对生态源地的影响。

  • 应用SHAP阐明阻力因子的贡献,揭示了阈值效应。

  • CatBoost-SHAP为因地制宜的优化提供了思路。

论文链接:

https://doi.org/10.1016/j.jenvman.2025.126905

图片

1文章摘要

科学划定城市周边生态源地、构建生态阻力面,对于理解景观连通性、提升区域生态安全至关重要,是实现现代城市生态文明建设高质量可持续发展的关键。

本研究选取涵盖自然与社会经济要素的关键指标作为生态阻力因子,结合SHAP(Shapley加法解释)的CatBoost 算法、电路理论,对湖州市生态安全格局进行了系统分析。结果表明:

1)识别出20个生态源地斑块,总面积1117平方公里;2)基于可解释机器学习结果,研究区东北部及中南部高生态阻力区面积为500.75平方公里,占区域总面积的8.6%;3)通过电路理论识别出40条生态廊道、348个生态夹点及11个生态障碍面。

研究结果支撑构建了 “两屏、三带、四廊、五区” 的空间框架。此外,通过三维真实地理空间景观模型(3dRGLm)增强空间认知,为生态关键区域提供可视化的优化规划思路。

本研究为推动区域高质量可持续发展提供了政策指导思路,对生态规划与管理具有重要实践意义。

关键词

生态安全格局;机器学习;生态阻力面;生态系统服务功能重要性;规划与启示

2文章引言

城市化快速扩张加剧了区域景观破碎化、栖息地隔离及物种间信息与物质交换受阻,导致生物多样性减少,引发水土流失、环境污染、土地退化等一系列生态环境问题,威胁人类生存环境与经济社会可持续发展,而城市生态空间作为日常生产生活的重要安全缓冲带,对城镇化中平衡经济发展与环境保护至关重要。

“生态安全” 概念应运而生以应对上述问题,其源于1987年《我们共同的未来》报告中的环境安全理念,1989年国际应用系统分析研究所首次阐释其内涵,强调其与人类社会的关联,且与军事、政治等安全同等重要。生态安全空间是维持生态系统功能、平衡经济发展与生态保护的核心,研究者发现景观格局、生态功能与过程的相互作用促进生态安全格局(ESPs)形成,该格局是保障生态系统功能可持续性的有效措施,其构建框架为 “生态源识别 - 生态阻力面构建 - 生态廊道提取”。

作为高质量发展与共同富裕示范区先行城市,湖州肩负探索共同富裕路径的使命,且拥有联合国全球地理信息知识与创新中心,为可持续发展提供支撑,因此本研究旨在科学自动构建生态安全格局,保障生态城市高质量可持续发展,维持生产与生态空间稳定,分阶段推进自然资源高质量保护、生态文明建设及人居环境转型三大目标。

3研究方法

图片

图1.研究流程图

3.1. 研究区域与数据

基本研究以浙江省湖州市(面积5820km²)为研究区,采用多源数据开展研究,包括30m分辨率土地利用、高程等基础数据,500m夜间灯光、100m人口密度等社会经济数据,以及河流、降水、植被覆盖度(FVC)等自然地理数据,数据经栅格化处理后统一至30×30m分辨率,投影坐标标准化为 WGS_1984_UTM_Zone50N。

图片

图1. 研究地理位置。

图片

3.2. 生态源地提取

先通过MSPA模型从森林、灌木林等生态功能强、人为干扰小的前景数据中提取核心区作为初步源地;

再评估碳汇(以植被净初级生产力为指标)、水源涵养、土壤保持、栖息地质量四项生态系统服务功能,采用CRITIC法加权得到生态功能综合质量指数,结合景观形态特征,通过自然断点法选取面积大于10km²的高功能区域作为最终生态源地。

3.3. 生态源地提取生态阻力因子选取

选取海拔、距河流距离、地表温度、植被覆盖度、人口密度、距道路距离、夜间灯等9项;

采用CatBoost算法构建阻力面,以生态源地(低阻力,正样本)和低生态服务功能区(高阻力,负样本)各8000个样点(样点间距 > 30m)为训练数据(按7:3划分训练集与测试集),通过分层5折交叉验证结合贝叶斯优化确定最优参数,以准确率、召回率、F1 分数及 AUC 评估模型性能。

最后,基于生态源地和阻力面,运用电路理论,通过Circuitscape的Linkage Mapper模块提取生态廊道,并识别夹点与障碍。

图片

图3. 生态阻力因子。 (a) 数字高程模型(DEM);(b) 地形起伏度;(c) 坡度;(d) 距河流距离;(e) 地表温度(LST);(f) 植被覆盖度(FVC);(g) 人口密度;(h) 距道路距离;(i) 夜间灯光。

4研究结果

4.1 生态系统服务功能(ESs)分析

2022年湖州市四项生态系统服务功能(碳汇、土壤保持、水源涵养、栖息地质量)空间异质性显著。其中,碳汇高及极高值区面积2616.04km²(占44.88%),主要分布在西南天目山、龙王山及支流、中南部莫干山和北部顾渚山;土壤保持高及极高值区2513.66km²(43.21%),集中于西南高森林覆盖率山区;水源涵养高及极高值区较小,为1124.36km²(19.34%),主要在中南部,与土壤黏粒含量高导致保水能力强但渗透性差相关;栖息地质量低及极低区仅588.1km²(10.1%)。

碳汇、土壤保持、栖息地质量空间分布整体呈现 “西南高、东北低”,水源涵养则为 “西南高、中部低”。

经MSPA初步筛选结合CRITIC法加权的四项服务功能评估,最终确定20个生态源地斑块(面积1117km²,占19.19%),主要位于安吉、德清、长兴县;低生态服务功能区面积1703.53km²(29.27%),集中在南浔区。

图片

图4. 生态系统服务功能(ESs)重要性及服务功能提取能力分区。(a)碳汇功能;(b)土壤保持功能;(c)水源涵养功能;(d)栖息地质量功能;(e)生态源地与低生态服务功能区的空间分布。

4.2 生态阻力面

阻力因子特征分析显示,DEM与其他因子交互最显著(与LST、夜间灯光、人口呈负相关,与FVC呈正相关),且各因子无共线性,样本分离度高。

对比七种机器学习算法,CatBoost表现最优,训练集AUC达0.998,测试集AUC为0.992,准确率、召回率等指标均超0.93。

特征重要性排序为:DEM(24.46)> 距道路距离(15.85)> 夜间灯光(11.77)> 距河流距离(11.38)>FVC(11.1)等。

SHAP分析揭示各因子阈值效应:如DEM在97.5m时影响反转(高于此值对生态源地为正效应),LST在26.13℃以上负面影响增强,FVC超0.75 时正效应更显著,人口密度超1.7 人/像素、距道路越近则负面影响越大等。

图片

图5. 阻力因子间的配对图(蓝色 0 代表低生态功能区;橙色 1 代表生态源地)

图片

图6. 机器学习模型的比较与选择

图片

图7. CatBoost模型中的特征贡献度与AUC表现

图片

图8. 基于CatBoost模型的SHAP特征依赖图

4.3 生态阻力面(ERS)空间分布

DEM、夜间灯光、LST 等为正阻力因子(值越高阻力越强),距河流、道路距离及FVC为负阻力因子(值越高阻力越弱)。

经自然断点分类与特征重要性加权叠加,高生态阻力区面积500.75km²(占8.6%),主要分布在东北部(城市交通枢纽,人类活动频繁、河网密集,阻碍生物迁移)和中南部(受地形影响,海拔高、坡度陡、地形起伏大)。

CatBoost模型预测的阻力面与实际现象高度吻合,可靠性强,体现出湖州市生态阻力面显著的空间异质性。

图片

图9. 基于CatBoost模型构建的湖州市生态阻力面(ERS)

4.4 生态修复关键区域

生态源地按生态流中心性分为关键(占 50.68%)、重要(28.26%)、一般(21.06%)三类,关键区主要在天目山、龙王山、莫干山,物种丰富且形成稳定生态屏障。

基于电路理论提取40条生态廊道(总长298.826km),分关键、重要、一般三类,关键廊道集中在天目山等区域,有效连接破碎化源地。生态连通性显示,天目山 - 龙王山 - 莫干山连通性最强,牟山 - 顾渚山最弱(受人类活动影响大)。识别348个生态夹点(总面积 22.87km²),最大者位于天目山 - 莫干山连接带(4.15km²);11个最高级生态障碍面(0.6km²)分散于天目山 - 莫干山区域,部分与夹点相邻,为亟需修复的关键区域。

图片

图10. 各生态要素的提取与分级

5研究讨论

通过整合MSPA和InVEST模型识别生态源地,结合景观形态与多项生态系统服务,较传统方法更全面,且识别的1117km²生态源地超过规划目标,与政策及文献一致,验证了可靠性。

贝叶斯优化的CatBoost 模型处理高维、非线性空间数据能力强,测试集AUC达0.992,结合SHAP揭示了DEM、FVC等因子的阈值效应,如DEM超97.5m 对生态源地呈正效应,LST超26.13℃负面影响增强等,印证了生态阻力的阈值特性。

基于此,湖州构建了 “两屏、三带、四廊、五区” 生态安全格局,“两屏” 为天目山和顾渚山生态屏障,“三带” 起缓冲整合作用,“四廊” 保障生态连通,“五区” 各有侧重,呼应当地规划。

图片

图11. 湖州市生态安全格局

3dRGLm通过三维虚拟空间增强人地关系认知,结合SHAP分析为生态空间建设提供定制建议,辅助决策。

图片

图12. 3dRGLm促进了湖州生态空间的优化。

研究存在局限性:碳储量评估未涵盖土壤碳汇及微尺度单元,数据分辨率不一致可能影响结果,生态廊道等需实地验证,模型普适性待考。

未来研究将向三维空间转型,细化城市绿色空间结构与生态过程,推动自然与社会经济协调发展,助力高质量可持续城市建设。

6研究结论

本研究整合MSPA-InVEST模型、贝叶斯优化的CatBoost算法及电路理论,对湖州市生态安全格局进行分析,旨在平衡区域保护与发展。研究结果为制定适宜的管理措施提供了可推广的科学理论依据。研究表明:

所选生态阻力因子未呈线性关系,且样本间存在显著分离。研究发现,CatBoost在处理非线性关系方面具有显著优势,模型预测精度较高。

影响生态源地的三个主要特征为数字高程模型(DEM)、距道路距离和夜间灯光。运用SHAP阐明各阻力因子的贡献值时,发现存在阈值效应;具体而言,当阻力因子超过某一阈值时,会对预测结果产生正向或负向影响。

基于包含生态源地、生态廊道及生态夹点的湖州市生态安全格局,划定了 “两屏、三带、四廊、五区” 的生态分区治理方案。此外,通过结合可解释机器学习与三维真实地理空间景观模型(3dRGLm),为优化区域生态安全提供了实践参考。

主管部门:
自然资源部
民政部
中国科协
京ICP备14037318号-1 京公网安备 11010802031220号
主办:中国测绘学会    技术支持 :江苏润溪时空智能科技股份有限公司
联系电话:010-63881345      邮箱地址:zgchxh1401@163.com
联系地址:北京市海淀区莲花池西路28号西裙楼四层