人工智能的突破可能引发医疗革命

人工智能已被用于预测人体制造的几乎每一种蛋白质的结构。


这一发展可能有助于加速发现治疗疾病的新药,以及其他应用。


蛋白质是生物体的重要组成部分;我们身上的每一个细胞都充满了蛋白质。


了解蛋白质结构对推动医学发展至关重要,但直到现在,这些结构中只有一小部分被研究出来。


研究人员使用一个名为AlphaFold的程序来预测属于人类和其他生物体的35万个蛋白质结构。


制造人类蛋白质的指令包含在我们的基因组中--包含在人类细胞核中的DNA。


人类基因组所表达的这些蛋白质大约有2万种。生物学家将这一完整的蛋白质组统称为 "蛋白质组"。


人工智能公司Deep Mind的首席执行官兼联合创始人Demis Hassabis博士在评论这些结果时说。"我们相信这是迄今为止人类蛋白质组最完整和准确的图景。


生物学最大的谜团之一 "基本解决了


人工智能征服了1980年代平台游戏的挑战


"我们相信这项工作代表了迄今为止人工智能对推动科学知识状况的最重大贡献。


"而且我认为这是一个很好的说明和例子,说明人工智能可以为社会带来什么样的好处。" 他补充说:"我们非常兴奋地看到社区将用这个做什么。"

bf32721d61af6fbf253725bef620ba41.webp.jpg

这项研究可能会导致产生能够分解污染我们环境的塑料的酶

AlphaFold预测的35万个蛋白质结构不仅包括人类蛋白质组中包含的2万个,还包括科学研究中使用的所谓模式生物,如大肠杆菌、酵母、果蝇和老鼠。


DeepMind研究人员和欧洲分子生物学实验室(EMBL)的一个团队在著名的《自然》杂志上描述了这一能力的巨大飞跃。


AlphaFold能够对人类蛋白质组中58%的氨基酸(蛋白质的组成成分)的结构位置做出自信的预测。


其中35.7%的位置被预测为具有非常高的置信度--是实验证实的数字的两倍。


不同蛋白质的结构布局可以通过各种技术来研究,包括X射线晶体学、低温电子显微镜(Cryo-EM)和其他技术。但这些都不容易做到。"朴茨茅斯大学的结构生物学家John McGeehan教授告诉BBC新闻,"做结构需要大量的资金和资源。


因此,复杂的三维结构通常被确定为有针对性的科学调查的一部分,但直到现在还没有一个项目系统地确定人体制造的所有蛋白质的结构。


事实上,只有17%的蛋白质组被实验证实的结构所覆盖。


在谈到AlphaFold的预测时,McGeehan教授说。"这只是速度问题--事实上,以前每个结构需要我们花六个月的时间,而现在只需要几分钟的时间。我们真的不可能预测到会发生得这么快。"


"当我们第一次向DeepMind团队发送我们的七个序列时,其中两个序列我们已经有了实验结构。因此,当他们回来时,我们就能够测试这些。这是其中一个时刻--说实话--我脖子上的汗毛都竖了起来,因为[AlphaFold]产生的结构是相同的。"

c9325c599911f9dc420c883b46150eef.webp.jpg

这一发展可以为治疗疾病的新药开发提供超强动力

EMBL的Edith Heard教授说。"这对我们了解生命是如何运作的将是变革性的。这是因为蛋白质是构成生物体的基本材料。


"应用只受限于我们的理解"。


我们现在可以设想的那些应用包括开发新的药物和疾病治疗方法,设计未来能够抵抗气候变化的作物,或能够分解弥漫在环境中的塑料的酶。


McGeehan教授的小组已经在使用AlphaFold的数据来帮助开发更快的降解塑料的酶。他说,该计划已经为那些无法通过实验确定结构的感兴趣的蛋白质提供了预测--帮助他们的项目加速 "多年"。


EMBL欧洲生物信息学研究所所长Ewan Birney博士说,AlphaFold预测的结构是 "自人类基因组图谱绘制以来最重要的数据集之一"。


DeepMind已经与EMBL合作,向全球科学界公开提供AlphaFold代码和蛋白质结构预测结果。


哈萨比斯博士说,DeepMind计划将数据库的覆盖范围大大扩展到科学界已知的几乎所有测序的蛋白质--超过1亿个结构。


评论