news 2026/5/7 12:21:39

Nature | 抛弃物理“最低能量点”:概率生成大模型如何颠覆长达30年的蛋白质设计铁律?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Nature | 抛弃物理“最低能量点”:概率生成大模型如何颠覆长达30年的蛋白质设计铁律?

引言

自然界的蛋白质经过数亿年的漫长进化,才打磨出支撑生命的复杂功能。然而,面对癌症、新发传染病以及日益严峻的气候危机,我们已无法再等待下一个百万年的自然选择。

4月30日,《Nature》的重磅综述“The past, present and future of de novo protein design”,系统总结了基于深度学习(Deep Learning)的计算方法如何引发蛋白质工程领域的范式转变。从头设计蛋白质(De novo protein design)正从随机筛选走向理性的定制化构建。

告别盲人摸象:生成式大模型重构分子设计法则

设计一个全新蛋白质的难点究竟在哪里?

从上世纪90年代到几年前,计算蛋白质设计的底层逻辑一直深植于物理化学模型。研究人员的出发点是著名的安芬森假说(Anfinsen's hypothesis),即蛋白质的折叠状态处于其氨基酸序列的全局自由能最低点。为了找到这个“最低点”,像 Rosetta 这样的软件试图通过计算范德华力、氢键、静电相互作用等物理量来评估数以亿计的可能结构。这种方法虽然极其严谨,但也极度耗时,且极易陷入局部最优解的陷阱。

如今,这场革命性的突破得益于深度学习模型的引入。AlphaFold 和 RoseTTAFold 等结构预测工具的成熟,提供了一种从序列空间到结构空间的全新映射方式。研究人员不再单纯追求“能量最低”,而是转向寻找“概率最高”的序列-结构对。这种概率计算的底气,源于全球结构生物学领域历经 60 年、耗资数十亿美元、由成千上万名研究人员共同构建的蛋白质数据库(PDB)。大模型通过学习这些已知结构的底层概率分布,掌握了生命的“语法”。

随后,基于扩散模型(Diffusion models)的生成式人工智能(AI)工具如RFdiffusion 彻底颠覆了设计流程。在设计之初,模型面对的只是一团完全随机的氨基酸残基“噪声”,通过逐步去噪,这些残基最终组织成具有高度互补性和特定功能的蛋白质结构。一旦骨架确定,ProteinMPNN 等序列设计工具就能迅速填补合适的氨基酸序列。这种骨架生成与序列设计的解耦与协同,让蛋白质设计摆脱了天然序列的束缚,真正实现了从功能需求出发的“逆向工程”。

突破天然界限:定制多维空间结构的组装模块

掌握了底层规律后,研究人员首先挑战的是设计全新的蛋白质折叠和组装形式。

早在2003年,世界上第一个具有原子级精度的全新折叠蛋白质 Top7 问世,证明了计算方法能够无中生有地创造出稳定结构。而如今,这种能力已经扩展到了极具挑战性的跨膜蛋白领域。研究人员成功设计了包含α-螺旋和 β-折叠的跨膜孔道和通道。例如,定制尺寸和内衬属性的 β-桶状孔道,为基于纳米孔的单分子 DNA 测序技术及广谱生物传感技术提供了更为理想的物理通道。

在微观尺度上,设计技术已经能够突破传统20种天然氨基酸的限制。通过引入非天然氨基酸,研究人员设计出了长度在 7 到 14 个残基之间的主链环化肽(Macrocyclic peptides),不仅在溶液中具有明确的结构,还展现出跨膜穿透和口服生物利用的潜力。甚至更小巧的 4 到 5 个残基组成的寡酰胺(Oligoamides)大环化合物也被成功合成,将蛋白质设计的边界直接拓展到了小分子药物的范畴。

在宏观组装层面,计算设计赋予了材料前所未有的对称性和规模。从最初的简单二聚体,到如今利用四个相互正交的组分,研究人员能够设计出直径高达 100 nm 的伪对称(Pseudosymmetric)纳米笼结构。这种模块化的设计思路,让蛋白质像乐高积木一样可以无缝拼接。以此技术为基础研发的二十面体纳米颗粒,已经促成了全球首个从头设计并获批临床使用的 COVID-19 疫苗(SKYCovione)。可以预见,通过设计对 pH 敏感的解离组分或整合具有靶向信号的亚基,未来的纳米疫苗和药物递送系统将具备极高的组织特异性。

靶向深水区:高亲和力结合蛋白的降维打击

自然界中,抗体是执行识别和结合任务的主力军。但在临床应用中,抗体体积庞大、稳定性差且生产成本高昂。那么,能否用更小、更稳定的从头设计蛋白质来替代甚至超越抗体呢?

答案是肯定的。如今,结合蛋白(Protein binders)的设计已经接近被彻底解决的边缘。研究人员通过 RFdiffusion 和 Bindcraft 等工具,已成功设计出针对 200 多个不同蛋白质靶点的高亲和力结合蛋白

在抗病毒领域,设计的微型蛋白质能够精准结合 SARS-CoV-2、流感病毒的刺突蛋白,甚至能中和致命的肉毒杆菌毒素和蛇毒。这些结合蛋白在经过部分扩散优化后,达到了皮摩尔(Picomolar)级别的结合亲和力。更为关键的是,由于其结构高度紧凑且具有极高的热稳定性,这类蛋白药物无需冷链运输,甚至可以制成鼻喷雾剂供大众日常预防使用。

不仅如此,计算设计还攻克了传统制药领域公认的“不可成药”靶点——内部无序区(Intrinsically disordered regions, IDRs)。这些区域缺乏固定的三维结构,传统的锁钥模型在此完全失效。研究人员利用诱导契合(Induced fit)的概念,让设计的蛋白质在结合过程中迫使 IDRs 采取特定的稳定构象。利用这一策略,针对致癌基因产物(如 β-连环蛋白)以及引发神经退行性疾病的 β-淀粉样蛋白的结合蛋白已被成功开发出来。

在免疫调控方面,通过设计针对细胞因子受体的高亲和力激动剂或拮抗剂(如 IL-2 和 IL-21 的模拟物),研究人员在动物模型中观察到了极其强效的抗肿瘤活性。不仅如此,通过构建 EndoTags 等靶向溶酶体降解的标签系统,结合蛋白可以精准招募 E3 泛素连接酶,实现对致病膜蛋白或胞外蛋白的靶向清除。

跨越能垒的炼金术:打造极高活性的定制酶引擎

如果说结合蛋白质是在玩“拼图”,那么设计具备催化活性的酶(Enzymes)则是在挑战化学反应的能量极限。

传统的酶工程主要依赖对天然酶的定向进化,但这往往受限于天然骨架的原始属性。从头计算设计的最终目标,是为一个全新的化学反应从零开始定制完美的催化位点。这就要求设计的蛋白质结构必须能够在原子级别精确排列催化基团,以极致的精度稳定化学反应的过渡态。

随着大模型技术引入,我们看到了令人振奋的突破。研究人员不仅能够设计针对特定小分子(如心脏病药物地高辛 Digoxigenin 或抗癌药物甲氨蝶呤 Methotrexate)的高亲和力传感器,还能直接针对酶的过渡态几何形态进行骨架生成。

具体的数据令人惊叹:以往针对模型化学反应(如 retro-aldol 反应)设计的酶,其催化效率(kcat/KM)仅为 180 M-1s-1。而借助新型生成工具(如 PLACER 深度学习方法)对催化位点预组织的筛选,新设计的荧光素酶(Luciferase)达到了 1400 M-1s-1,丝氨酸水解酶达到了 3800 M-1s-1。更引人瞩目的是,一款从头设计的锌水解酶催化效率飙升至53000 M-1s-1,而在一些高度优化的丝氨酸水解酶设计中,这一数值甚至突破了 2.2 × 105M-1s-1

不仅如此,结合血红素(Haem)等多核金属簇辅助因子的酶也被成功设计。对于那些需要克服极高能垒的非自然化学反应,比如降解难降解塑料,基于全新骨架的金属水解酶已经展现出了强大的应用潜力。

逻辑门与动态齿轮:唤醒未来的智能分子纳米机器

掌握了静态结构设计、分子结合以及化学催化之后,从头蛋白质设计正在迈向它的终极形态:构建能够对外界刺激做出动态响应、具备多稳态和逻辑运算能力的分子纳米机器。

生命的底层逻辑往往伴随着信息处理和能量转换。研究人员设计出了名为LOCKR 的智能系统。这是一种能够执行布尔逻辑(Boolean logic)运算的蛋白质开关。在嵌合抗原受体 T 细胞(CAR-T)疗法中,它可以被设计成只有当靶细胞表面同时存在两种特定的标志物(即执行“与”逻辑,AND logic)时,才会解除一段多肽的隐藏状态,进而招募效应蛋白杀伤癌细胞,从而最大限度地减少对健康组织的误伤。

在动态调控层面,研究人员开发出了由效应物(如特定肽段或钙离子)驱动的变构组件。通过在一个远离作用中心的位置结合效应肽,可以诱导整个蛋白质复合体解离或改变其寡聚状态。动力学数据显示,在这种变构肽的控制下,细胞因子信号的持续时间可以从原来的 1 小时精准缩短至 40 分钟。

更具科幻色彩的,是这种定制能力正延伸向材料科学与可持续发展领域。研究人员设计出了能够精确引导无机晶体成核的蛋白质模板,例如控制碳酸钙(CaCO3)的多晶型结晶过程,以探索一种全新的二氧化碳(CO2)固定方案。在人工光合作用方向,成功设计出能够容纳且维持叶绿素特殊对(Chlorophyll special pairs)激子耦合的同源二聚体蛋白质,这为未来利用太阳能驱动的高效多电子化学反应奠定了物理基础。

在这个领域,当前的核心挑战已经不再是“如何设计”,而是“应该设计什么”。虽然在免疫原性验证、大规模生物制造等方面仍有现实问题需要克服,但从头蛋白质设计已经不可逆转地重构了我们与分子世界的交互方式。可以预见,在接下来的十年中,整合了结合、催化和动态构象变化的智能生物材料,将带领我们走向一个全面定制分子的新纪元。

参考文献

Yang W, Wang S, Lee GR, Zhang JZ, Courbet A, Juergens D, Wang X, Schlichthaerle T, Abedi M, Ragotte R, An L, Kalvet I, Pellock S, Mihaljevic L, Glasscock C, Pillai A, Broerman A, Ennist N, Haefner E, McNamara-Bordewick N, Haydon I, Stewart L, Bhardwaj G, Baker D. The past, present and future of de novo protein design. Nature. 2026 Apr;652(8112):1139-1152. doi: 10.1038/s41586-026-10328-7. Epub 2026 Apr 29. PMID: 42056544.

转载请注明来源于【游离的DNA】

声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!


往期热文:

  • Science | 进化史上的“借壳上市”:质粒分配马达如何演化为决定形态的细胞骨架?

  • Science | 重定义传染病防治逻辑:体内构建自我扩增的“超级抗体工厂”

  • Nature | 从序列识别到表观感知的跨越:新型ThermoCas9重塑基因编辑精度边界

  • Cell | 从光遗传到“磁遗传”?非侵入式“电磁场基因开关”问世,实现体内深层组织的高分辨时空遥控

  • Nature Medicine | 筛查范式亟待重塑:当50%的食管癌找不到癌前病变,我们的防线该如何前移?

  • Cell | 从“基因突变”到“微生态演替”:重塑我们对癌症起源的底层认知

  • Nature Biotechnology | 体内基因编辑新纪元:打破毒性枷锁,重塑肿瘤靶点发现的精准导航

  • Nature Medicine | 一半是奇迹,一半是深渊:研究披露靶向KCNT1 ASO疗法的“双刃剑”效应

  • Nature Genetics | 颠覆传统认知:没有染色质环挤压,基因调控网络也能“从零”重建?

  • Nature Medicine | 从局部响应到系统广播:198个外周血标志物改写女性生殖健康研究的底层逻辑

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/7 12:17:28

GetQzonehistory:永久保存你的QQ空间青春记忆,一键备份所有说说

GetQzonehistory:永久保存你的QQ空间青春记忆,一键备份所有说说 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否还记得那些年在QQ空间写下的第一条说说&am…

作者头像 李华
网站建设 2026/5/7 12:16:29

3步搞定缠论分析:通达信ChanlunX插件终极指南

3步搞定缠论分析:通达信ChanlunX插件终极指南 【免费下载链接】ChanlunX 缠中说禅炒股缠论可视化插件 项目地址: https://gitcode.com/gh_mirrors/ch/ChanlunX 还在为复杂的缠论分析头疼吗?面对K线图上密密麻麻的顶底分型,你是否感到无…

作者头像 李华
网站建设 2026/5/7 12:14:35

Python视频下载工具vidclaw:自动化抓取、解析与批量下载实战

1. 项目概述:一个面向视频内容聚合与下载的自动化工具 最近在折腾一些视频素材的批量收集,发现手动去各个平台找、一个个下载,效率实在太低了。正好在GitHub上看到了一个叫 vidclaw 的项目,作者是 Cashnaruto 。这个工具的名字…

作者头像 李华
网站建设 2026/5/7 12:13:56

基于Next.js自建GPT-4 Playground:安全本地部署与双环境实践

1. 项目概述与核心价值 最近拿到了GPT-4的API密钥,想找个地方好好“遛一遛”它,却发现官方的Playground在长文本支持上有点束手束脚,而想体验完整的对话环境又得额外付费订阅ChatGPT Plus。这种割裂感对于开发者或者只是想深度体验一下GPT-4…

作者头像 李华
网站建设 2026/5/7 12:11:35

长芯微LDC7478完全P2P替代AD7478,是一款8位的ADC 芯片

描述长芯微LDC7478是一款8位的ADC 芯片,即模拟数字转换器,具有高精确度、高速率、低功耗、小尺寸、单极性的基本特征。产品采用2.35V-5.25V单电源供电,采样率最高可达1 MSPS。 LDC7478采用6引脚SOT-23封装,工作温度范围为-40℃至8…

作者头像 李华
网站建设 2026/5/7 12:09:31

开源AI应用框架alt-gpt-v0:模块化架构与本地化部署实践

1. 项目概述:一个面向未来的开源AI应用框架最近在GitHub上闲逛,发现了一个名为“feedox/alt-gpt-v0”的项目,点进去一看,立刻被它的定位吸引了。这并非一个简单的聊天机器人复刻,而是一个旨在构建“替代性GPT应用”的开…

作者头像 李华