张学工课题组发布细胞级组装的人体集成细胞图谱hECA

近日,自动化系、信息国家研究中心张学工教授课题组在《细胞》(Cell)旗下期刊《交叉科学》(iScience)在线发表了题为“hECA: the cell-centric assembly of a cell atlas”的论文。该论文聚焦目前国际上诸多单细胞图谱建设计划中普遍缺乏有效的信息索引和查询架构、难以将海量基因表达文件组装为真正的“细胞图谱”的瓶颈问题,提出了“细胞级组装”的细胞图谱建设理念,建立了一种能够无缝组装海量单细胞数据的统一信息学框架,并基于此框架建成了首个细胞级组装的人类集成细胞图谱human Ensemble Cell Atlas(hECA)。

hECA涵盖了来自116个公开数据集、包括38个器官和11个系统的109万个人体细胞,这些细胞的基因表达等信息被统一存储到了一个支持超宽超深数据存储、管理和索引的数据库系统之中,形成统一的细胞信息表,可实现秒级的数据快速检索查询,突破了细胞图谱研究中数据分散、整合困难等关键问题。在该框架下,文章进一步提出了“数基细胞筛选”、“数基细胞实验”、“多生物学实体全息画像”等细胞图谱应用新范式。相关成果为在细胞水平系统探索人体在发育、疾病等过程中的动态和变化提供了全新的方法工具,可以帮助研究者发现传统生物学实验难以触及的跨细胞、跨器官本质规律,为未来生物医学研究提供了全新的解决方案。

本论文完成人来自自动化系/信息国家研究中心的张学工、江瑞、汪小我课题组以及福州数据技术研究院,通讯作者为张学工,第一作者为陈斯杰、罗燕婷、高浩翔、李范红、陈奕鑫、李嘉骐。