自动化系汪小我团队在生物调控元件智能设计上取得突破性进展

        5月19日,国际知名学术期刊《核酸研究》(Nucleic acids research)以“突破性研究论文(Breakthrough Article)”形式在线发表了清华大学自动化系汪小我课题组题为“基于深度生成式模型的大肠杆菌合成启动子设计“ (Synthetic promoter design in Escherichia coli based on a deep generative network) 的研究论文。该项研究首次用人工智能方法设计产生全新的基因启动子,为生物调控元件的设计和优化提供了崭新的手段。

        基因调控元件作为搭建合成生物系统的基石,在代谢工程、基因治疗等领域有广泛用途。工程生物系统的构建需要大量具有优良性能的调控元件作为支撑,以适配不同底盘细胞和工作环境的需求。过去,人工元件的获取主要通过对自然元件的简单改造,例如通过对天然序列的随机突变、功能片段拼接组合等方法,结合定向进化等实验来筛选获得新的元器件。这些方法一方面成功率低,另一方面通常只能获得与天然序列非常相似的元件,难以发现全新的调控元件。以100碱基长度的序列为例,其潜在的序列组合达到了4100种可能, 但天然的元件仅占其中很小一部分,潜在的序列空间远超目前实验文库的筛选能力。

        随着人工智能和大数据时代的到来,深度学习技术在复杂对象的特征表征、多模态融合、样本自动生成等问题中表现出独特的优势,为生物分子的设计提供了新的可能。该研究将人工智能技术应用于构建全新的基因调控元件,从自动化设计的角度,利用深度学习技术并融合生物先验知识来建立调控元件的生成模型。通过在计算机中的算法寻优部分替代生物实验上的随机搜索,可以大大提高实验的成功率。课题组在大肠杆菌中成功实现了全新基因启动子的设计与生成。该方法可以产生大量全新的启动子,经过迭代优化后实验验证成功率已超过 70%。这些由人工智能方法设计的全新元件具备了天然元件关键特征的统计特性,并同时具有一些非天然典型的序列模体,在整体序列排布上可以做到与天然启动子很低的相似性,降低了与天然基因组的同源重组风险。同时,优化后的人工元件可以具备比天然序列更高的转录活性。理论上,该方法可以产生数量远远超过天然启动子的全新元件,极大地丰富了可用于工程生物学研究的调控元件库。

        该研究从实践上证明了利用人工智能方法创造全新生物调控元件的可行性,对推动工程生物系统更加高效、安全、可控的智能化设计与构建具有重要意义。人工智能技术与工程生物技术的交叉,未来将可能对促进代谢工程、分子育种、基因治疗等领域的发展产生深远影响。

        该论文被《核酸研究》期刊编委会推选为突破性研究论文(Breakthrough Article)进行亮点报道(占该期刊发文量的1-3%)。突破性研究论文入选标准是”回答了在核酸研究领域的长期关键性问题,开辟了新的研究领域,代表该刊发表的最具影响力和创新性的研究成果。”

        自动化系长聘副教授汪小我为论文的通讯作者,自动化系博士生王也、王昊晨为论文共同第一作者,自动化系博士后魏磊、教师刘莉扬和生命学院本科生李帅霖为论文共同作者。该项研究受到国家自然科学基金创新研究群体项目的经费资助。

清华新闻网链接:https://news.tsinghua.edu.cn/info/1007/79192.htm

原文链接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkaa325/5837049

核酸研究突破性论文链接:http://www.narbreakthrough.com

 

 

免疫微环境是肿瘤发生发展的关键因素,肿瘤具有复杂的空间结构,肿瘤免疫微环境的空间异质性一直缺乏系统性的研究。利用最新的单细胞蛋白质组、转录组检测与生物信息分析技术,研究中心、自动化系古槿课题组与上海东方肝胆外科医院王红阳院士、陈磊研究员课题组对肝癌免疫微环境的空间异质性进行了深入解析,发现肿瘤边界区富集的T细胞亚群可作为新型肝癌预后标志物以及潜在的免疫治疗靶点。该项研究成果发表于《尖端科学(Advanced Science)》,郑博、王东方、邱辛瑶、罗贵娟是论文并列第一作者。

学术交流:

5月11日:国家蛋白质科学中心(北京)举办以“蛋白质组学驱动的精准医学” 为主题的2020年第一季度学术研讨会,生物信息学研究部李梢教授应邀参会,并就肿瘤与蛋白质网络、网络药理学研究作了发言。