当前位置: >首页 >资讯中心 >团体会员动态
龚健雅/吴华意/桂志鹏团队在流形学习领域取得重要进展
发布时间:2025-09-15     来源:武大遥感学院     浏览:31次


0915-002.png

近日,人工智能顶刊《自然·机器智能》(Nature Machine Intelligence, IF=23.9)在线发表了题为“Sampling-enabled scalable manifold learning unveils the discriminative cluster structure of high-dimensional data”的研究成果,提出一种基于均匀地标采样的可伸缩流形学习方法SUDE,能够实现高维数据的快速降维,提升类簇之间的可区分性,为流形数据的可视化、分类和聚类任务提供支撑。

该研究在龚健雅院士、测绘遥感信息工程国家重点实验室吴华意教授和我院桂志鹏教授指导下完成,论文第一作者为我院地理信息工程系博士后彭德华(我院14级本科生),通讯作者为桂志鹏教授。合作者还包括我院25级博士生卫文章、斯坦福大学地球系统科学系博士后栗法(我院12级本科生)和东南大学网络空间安全学院桂杰教授。武汉大学遥感信息工程学院为第一作者单位。

图片

图1 SUDE概念框架及在人造数据集的表现

流形假设认为高维数据往往位于高维欧氏空间中的平滑低维流形之上,直接在原始特征空间对高维数据进行分类和聚类存在潜在的维度灾难问题。流形学习旨在揭示高维空间中复杂非线性流形的内在低维结构,将数据嵌入到聚类友好的低维特征空间,缓解维度灾难带来的负面影响。尽管现有技术(如t-SNE和UMAP)已在诸多领域广泛应用,但对于类簇的区分能力相对有限,难以保留连续的拓扑结构,且计算的可伸缩性存在不足,限制了其在大规模流形数据处理场景下的适用性。

图片

图2 SUDE在真实数据集的性能表现

针对上述问题,论文提出一种基于均匀地标采样与约束局部线性嵌入的可扩展流形学习方法SUDE。它通过地标采样选取部分重要样本作为地标点进行嵌入学习,确定高维数据在低维空间的主要骨架,再根据非地标点与地标点的局部线性关系将其快速嵌入至低维空间,极大提升了非线性流形学习的计算伸缩性。论文创新性地提出一种重尾低维概率分布,增强了类簇之间的分离性,并通过对非地标点嵌入施加最邻近距离约束,缓解了欠采样引发的脏簇问题。

图片

图3 SUDE应用于心电图异常心跳检测

论文在27个不同类型的数据集上验证了SUDE的有效性,将方法应用于单细胞类型注释、伪轨迹分析和心电图异常检测等典型场景。结果表明,SUDE在聚类、分类精度和计算效率上均取得显著优势,其中在UCI、CIFAR10、MNIST和FMNIST等12个真实数据集上的平均聚类精度比主流流形学习方法t-SNE和UMAP分别高11.9%和5.2%,计算效率分别提升6.5倍和2.3倍。

论文链接:

https://www.nature.com/articles/s42256-025-01112-9

主管部门:
自然资源部
民政部
中国科协
京ICP备14037318号-1 京公网安备 11010802031220号
主办:中国测绘学会    技术支持 :江苏润溪时空智能科技股份有限公司
联系电话:010-63881345      邮箱地址:zgchxh1401@163.com
联系地址:北京市海淀区莲花池西路28号西裙楼四层