近日,上海交通大学溥渊未来技术学院辛弘毅老师团队Novellab实验室1篇论文被国际机器学习顶级学术会议 ICML 2026(The International Conference on Machine Learning) 正式录用,论文题目为“InfoGlobe: Local-and-Global Information-Preserving Statistical Manifold Learning for Single-Cell Transcriptomics”。论文聚焦于单细胞与空间转录组数据分析中的几何建模方法。该成果标志着溥渊未来技术学院在计算生物学、单细胞组学与理论建模方向的新突破。
会议简介 Conference Introduction
ICML (The International Conference on Machine Learning)是机器学习领域最具影响力的国际顶级会议之一,聚焦机器学习理论、算法及其在人工智能各方向中的应用,在全球范围内具有极高的学术影响力。ICML 2026年度会议将在2026年7月10日召开。
研究背景 Research Background
单细胞转录组分析的核心任务之一,是在高维基因表达空间中准确刻画细胞之间的相似性与发育关系。然而,现有降维方法往往更擅长保留局部邻域结构,但是难以同时维持细胞状态之间的全局几何关系,因而可能在轨迹推断、细胞亚群识别和跨批次比较中造成结构失真。针对这一问题,Novellab 实验室提出了全新的统计流形学习框架 InfoGlobe,尝试从信息几何的角度重新定义单细胞数据的低维表示方式。
研究成果 Research Results

图1: 针对信息几何的单细胞组学分析框架InfoGlobe
InfoGlobe 将单细胞 RNA 计数建模为多项分布,并利用基因层面与功能基因组层面之间的嵌套关系,证明二者在 Fisher–Rao 信息度量下具有等距性。基于这一性质,该方法可将高维转录组空间映射到低维超球面,在压缩维度的同时尽可能保留原始数据中的信息几何结构。与传统依赖欧氏空间近似的表示方式不同,InfoGlobe 关注细胞状态在统计流形上的真实测地关系,因此能够同时兼顾局部邻近性与长程结构。
这一框架还赋予了低维表示更强的生物学可解释性:每个潜在维度都可对应为一组功能相关的基因程序,使模型不仅能够区分“是否表达”的定性差异,也能捕捉“表达强弱变化”的定量差异。实验结果显示,InfoGlobe 在局部与全局结构保持、聚类准确性、基因程序发现以及细胞亚群解析方面均优于多种现有方法;同时,它还能自然分离批次相关信号,在无需显式对齐的情况下缓解测序深度差异带来的 batch effect。

图2: InfoGlobe可在多批次数据中自解析细胞的生物功能因子并识别批次因子,去除数据集间的批次效应
在空间转录组数据中,InfoGlobe 同样展现出良好的适配性。将其作为下游空间分区算法的输入后,可更准确地识别组织中细微但关键的病理边界,提升空间结构解析能力。总体而言,InfoGlobe 为单细胞与空间组学分析提供了一种兼具几何一致性、统计严谨性与生物学可解释性的新范式,也为未来构建更加稳定、统一的细胞状态表示框架提供了新的思路。
论文的共同第一作者为溥渊未来技术学院博士生王程、浦江国际学院博士生蔡金蒲和溥渊未来技术学院2023级本科生毛崇晓(溥渊未来学者计划),论文的通讯作者为剑桥大学助理教授连秋宇和溥渊未来技术学院副教授辛弘毅。
作者简介

王程
上海交通大学溥渊未来技术学院博士生,主要研究方向为单细胞多组学数据中的细胞与基因表征及其在下游分析中的应用。

蔡金蒲
上海交通大学浦江国际学院博士生,曾在北京协和医学院阜外医院、国家心血管病中心联合培养。主要研究方向为单细胞多组学数据分析及心血管疾病机制研究。以第一作者身份在 Briefings in Bioinformatics、RECOMB、ACM-BCB 等国际期刊与会议发表论文 6 篇,曾获 ACM-BCB Best Paper Award。

毛崇晓
上海交通大学溥渊未来技术学院23级本科生,入选溥渊未来学者计划。主要研究方向为单细胞与转录组数据分析,在辛弘毅老师指导下开展生物与计算交叉研究。主导HTO-转录组联合分析的多细胞液滴识别与新细胞类型发现流程,参与多项交叉科研项目,3篇论文被ICML,ACM-BCB等会议接收,曾赴新加坡南洋理工大学交流学习。
通讯作者简介

连秋宇
博士,现任剑桥大学格登研究所(Gurdon Institute)助理研究教授。博士毕业于清华大学自动化系,曾在上海交通大学密西根学院及剑桥大学格登研究所从事博士后研究。长期致力于应用人工智能、数学与统计建模等计算方法,研究干细胞命运调控规律及其与发育、衰老和癌症发生等生物过程之间的关系。相关研究成果发表于Developmental Cell、Blood、Hepatology、Nature Computational Science等国际学术期刊。

辛弘毅
博士,上海交通大学溥渊未来技术学院长聘教轨副教授,同时受聘于电子信息与电气工程学院自动化系,国家级青年人才。博士毕业于卡内基梅隆大学计算机科学系,曾在美国匹兹堡大学医学院从事博士后研究。辛弘毅副教授长期从事生物信息学与人工智能交叉研究,聚焦于单细胞与多组学数据分析的机器学习与统计方法,并将相关方法应用于癌症、免疫学及精准医学等重要生物医学问题。同时,他在组合优化算法以及稳定、可解释人工智能方法方面也开展了系统研究。其研究成果发表在 Genome Biology、Nature Machine Intelligence、Nature Communications、Nucleic Acids Research、Cell Reports 等国际顶级期刊,并多次在 RECOMB、ISMB 等计算生物学顶级国际会议上进行首要报告。曾入选腾讯“犀牛鸟”人才计划。