2025年3月25日,西湖大学医学院郭天南团队在 Cell Research 发表了题为 GrowAIVirtualCells: ThreeDataPillarsandClosed-LoopLearning 的评述文章,探讨了人工智能虚拟细胞(AIVCs)在生物医学领域的发展方向。AIVCs的核心思想是通过人工智能与多模态数据的整合,构建精准且可扩展的虚拟细胞模型。这种方法相比于传统虚拟细胞模型,更全面地模拟了细胞功能,并展现出高通量仿真能力,甚至在某些情况下,能够替代实际实验。
文章深入探讨了AI虚拟细胞(AIVCs)的构建方法与发展方向,强调了三大数据支柱——先验知识、静态结构和动态状态的核心作用。研究指出,高通量组学数据,尤其是微扰蛋白质组学数据在动态模拟中的关键性。此外,文章还提出了闭环主动学习系统,结合AI预测与自动化实验,以自适应的方式加速细胞建模与科学发现。为提升AIVC概念的可行性,研究者建议从酵母(Saccharomyces cerevisiae)等信息丰富的简单细胞模型入手,逐步扩展至更复杂的人类癌细胞系,从而推动AIVCs在生物医学、药物开发和个性化医疗等领域的应用。
在生物医学研究中,细胞是生命的基本单位,对于健康、衰老、疾病的理解以及药物开发至关重要。然而,传统的细胞实验常常消耗大量资源,实验结果也易受变异影响。在此背景下,虚拟细胞或数字细胞的概念应运而生,旨在降低实验成本,提高研究的精确性和效率。早期虚拟细胞模型主要依赖低通量生化实验,通过微分方程或随机模拟方法建模特定细胞过程,但在数据整合和动态模拟方面却存在局限性。因此,人工智能虚拟细胞(AIVCs)作为一种新的研究方向,结合了多模态数据与先进计算模型,为生物医学研究提供了新的可能性。
为了更有效地支持AIVCs的发展,研究团队提出了三大数据支柱,作为构建AIVCs的核心数据基础:先验知识、静态结构和动态状态。这些支柱的数据结合AI算法,为虚拟细胞的构建提供了必要基础。先验知识涵盖了生物医学文献、分子表达和多尺度成像数据,尽管信息庞杂且多样,难以直接用于完整构建AIVC,但它们是基础框架的关键。
静态结构代表细胞形态学和分子组成,包括多个技术的应用,例如纳米尺度分子建模和低温电子显微镜等。为了构建真实“活”的AIVC,动态状态是不可或缺的,它涵盖生理过程和外部微扰对细胞的影响。如今,随着高通量组学技术的发展,系统性分析大量分子在不同细胞状态下的变化,AIVC的准确性得以显著提高。文中强调,微扰蛋白质组学数据是推动AIVCs发展的关键,通过AI整合微扰数据,AIVC能够更精确地预测细胞对外部干预的反应,为药物开发提供更强的支持。
AIVCs正从静态的数据驱动模型演变为自适应进化系统,其中闭环主动学习系统是核心。这种系统结合AI预测与自动化实验,能够主动探索细胞动态状态,填补数据空白,显著加速科学研究。相比传统方法,闭环系统更高效地处理细胞对各种扰动的复杂响应。AI能够选择最具影响力的实验,最大化数据取得的价值,进而推动细胞生物学研究由被动观察转向主动探索、自我优化的方向。
AIVC的细胞模型选择至关重要,不同候选细胞各有优劣。研究认为,从酵母开始是一个低门槛的切入点,因其结构简单、数据丰富,并且已广泛应用于生物学与药物筛选领域。虚拟酵母细胞将作为AIVCs的起步方向,后续的人类癌细胞系则是更复杂模型的目标,推动AIVCs在精准医学和药物开发中的应用。
总的来说,AIVCs在药物开发、疾病建模及基础生物学研究方面的前景广阔,而科学界的共同协作则是推动这一领域发展的关键。建立AIVCs的标准和最佳实践,将是该领域下一个阶段的重要任务,以确保在计算生物学和生物医学研究中实现其潜在的革命性影响。未来,伴随技术的进步,AIVCs有望为生命科学研究注入新动力,推动精准医疗的进展。
1月12日,西湖大学的郭天南团队联合深势科技/北京科学智能研究院的温翰团队,在bioRxiv上一种发表了预印本文章,介绍了一个名为ProteinTalks的基础模型。该模型通过整合大规模动态微扰蛋白质组数据,能够准确预测药物反应,具有广泛的精准医学应用潜力。研究人员期待将来能进一步完善AIVC,以便于药物研发及系统生物学等领域的应用。