
从诺奖项目到生成式药物设计,Latent Labs 创始人 Simon Kohl:AI 正在让生物学进入「可编程时代」 | CVPR 2026
Quick Answer
This paper shows that Simon Kohl, CEO of Latent Labs, presented at CVPR 2026, highlighting how generative AI, including models like Latent-X1 and Latent-Y, is revolutionizing drug design by drastically reducing development times and costs, achieving up to 90% success rates compared to traditional methods.
Quick Take
Simon Kohl, CEO of Latent Labs, presented at CVPR 2026, highlighting how generative AI, including models like Latent-X1 and Latent-Y, is revolutionizing drug design by drastically reducing development times and costs, achieving up to 90% success rates compared to traditional methods. The transition from AlphaFold 2's structural predictions to autonomous design agents marks a pivotal shift towards programmable biology.
Key Points
- Latent-X1 achieves high affinity and hit rates, outperforming traditional trillion-scale screenings.
- Latent-X2 enables zero-shot antibody design, maintaining high affinity across various formats.
- Latent-Y is the first lab-validated antibody design agent, streamlining the drug development process.
- AI-driven methods reduce drug development time from years to weeks, significantly lowering costs.
- Protein dynamics and systemic toxicity predictions remain open challenges in AI drug design.
Article Content
From source RSS / original summary作者|吴思梦编辑|岑峰 2026年6月3日,计算机视觉与模式识别顶级会议(CVPR)在美国丹佛举行。 在大会特邀演讲环节,前 DeepMind 蛋白质设计团队核心成员、2024年诺贝尔化学奖获奖项目 AlphaFold 核心研究员,Latent Labs 创始人兼 CEO Simon Kohl 发表了题为“Programmable Biology:Generative AI for Molecular Design”的精彩演讲。 围绕当今药物发现领域最核心的痛点:一种新药从研发到上市平均耗时超过10年、花费超20亿美元,但九成候选药物最终失败。 而Simon Kohl认为,这一切的根源在于“我们从错误的分子出发”。 为此,他提出了一条从“结构预测”到“条件生成”再到“自主智能体”的技术跃迁路线。
演讲以AlphaFold 2为起点,回顾了蛋白质结构预测突破如何催生生成式药物设计;随后展示了Latent Labs的两代基础模型——Latent—X1(通用蛋白结合物设计)与Latent—X2(零样本抗体设计)——如何在湿实验室中实现媲美甚至超越传统万亿级筛选的命中率和亲和力;最终发布了全球首个实验室验证的抗体设计智能体Latent—Y,仅需一条自然语言提示,即可自主完成从靶点分析到分子设计的全流程。 总结而言,从AlphaFold 2解决“序列到结构”的预测问题,到生成式AI实现“靶点到药物”的条件设计,再到智能体接管“端到端”的自主设计闭环——计算药物设计正以指数级速度演进,Simon Kohl断言:生物学终将成为可编程的工程学科。
以下是Simon Kohl在CVPR 2026大会上发表的演讲精编稿,雷峰网·AI科技评论基于原英文演讲内容进行了不改原意的翻译编辑: 《Programmable Biology : Generative AI for Molecular Design》主讲人:Simon Kohl,Latent Labs 创始人兼 CEO 药物发现的困境:10年、20亿、九成失败在进入正题之前,我想让大家先对“药物如何起效”建立共识。 药物的作用机制,一言以蔽之,就是结合,并且通常是阻断。 比如司美格鲁肽(Semaglutide),它是一个合成肽类药物,通过结合并激活GLP-1受体来治疗二型糖尿病和肥胖症;再比如Caplacizumab,这是一种源自羊驼的纳米抗体,通过阻断血小板间相互作用来治疗凝血障碍;还有曲妥珠单抗(Trastuzumab),一种人源化抗体片段,通过阻断HER2受体来治疗乳腺癌和胃癌。 它们的共同点都是:结合并阻断靶点。 那么,今天的药物是如何被发现的呢? 典型流程通常超过10年。 首先,你得找到一个初始筛选材料(Starting Material)——而在今天,行业内主要有三种主流方式。
第一种是体内免疫法(In vivo immunization)。 大型药企真的在经营着庞大的羊驼和鲨鱼农场,试图从这些动物的免疫反应中筛选出抗体。 但问题是,羊驼并不是人类;这些分子充其量只能算是一个起点——它们不仅不可控,而且不够精准。 第二种是超大规模库筛选(Massive library screening)。 这种方法说白了,就是把成百上千亿的化合物“像扔意大利面一样往墙上砸,看哪个能粘住”。 这种方式虽然不需要动物,但筛选出来的分子通常亲和力很弱,而且成本极高、极其耗时。 第三种是B细胞挖掘(B-cell mining),也就是直接从疾病幸存者的血液中提取天然成熟的抗体。 虽然这些是人类自带的抗体、亲和力极强,但这种方法高度依赖供体,根本无法实现规模化扩展,同时还面临着错综复杂的伦理和准入门槛。 获得起点后,还要在动物模型中证明安全性(约3年),再经过临床I期(安全性)、II期(剂量)、III期(大规模验证),最终能获得FDA批准的药物,十中无一。 这就是当前药物发现的漏斗——超慢、超贵(20亿美元+)、90%失败。 而我认为,这一切的根源在于我们从错误的分子出发。
这正是我们在Latent Labs想要改变的——从头设计药物,让它们有更高的概率通过临床试验,更便宜、更快。 想象一个世界:针对任何疾病靶点,我们只需将靶点输入生成式模型,模型就能即时产出可用的药物分子。 这需要高特异性结合、可制造性、低多反应性等一系列属性。 这就是我们的愿景。 计算药物设计的五年加速:从AlphaFold 2到智能体回顾计算药物设计领域过去五年的进展,我认为我们取得了巨大的进步,在某种程度上堪比大语言模型的能力跃升。 2020年,AlphaFold 2横空出世,解决了蛋白质结构预测问题——这是整个领域的“种子突破”。 此后几年,RFdiffusion和ProteinMPNN等首批蛋白质设计生成模型问世,目标是生成自然界不存在的、在实验室中能工作的蛋白质。 2024年,AlphaFold 3发布,新增了蛋白质相互作用建模能力,这恰恰是药物设计所需的核心能力。 随后,DeepMind发布了AlphaProteo(蛋白质结合物设计),Latent Labs推出了Latent—X1。
而在过去12个月中,抗体设计领域迎来了一系列突破——抗体设计被称为这一领域的“圣杯”,比一般结合物设计难得多,且直接面向制药行业最核心的药物类别。 Latent Labs的Latent— X2、Chai Discovery的Chai-2、Nabla Bio的JAM等模型相继问世。 最近,Latent Labs发布了全球首个实验室验证的抗体设计智能体Latent—Y。 我要强调的是:仅仅五六年间,我们就从“一切都在实验室做”跃迁到了“智能体在跑抗体设计”——这是指数级的加速。 蛋白质:比图像更脆弱的分子机器在深入模型之前,让我先给一个蛋白质的入门介绍。 蛋白质是生命必需的分子机器,由氨基酸链折叠成三维结构。 从计算机科学的角度看,蛋白质是一条由20个字母(氨基酸)组成的字符串,每个字母对应特定的原子集合和生物化学性质。 关键在于:结构决定功能。 而且蛋白质有一个非常特殊的性质——即使只有一个氨基酸突变,蛋白质也可能完全丧失功能。 对CVPR的听众来说,一个精准的类比是:就像一个像素的错误就能毁掉一张图片——当然,人类视觉是鲁棒的,改变一个像素图片依然连贯,但蛋白质不是这样。
我以鸡蛋清蛋白为例:如果将其核心位置的赖氨酸突变为丙氨酸——仅仅是“一个字母的切换”——整个蛋白就会解体,失去结构和功能,变成无序蛋白。 这种突变也是癌症的常见诱因。 所以你完全不能弄错哪怕一个氨基酸。 这就引出了蛋白质折叠问题:1972年,Anfinsen在诺贝尔化学奖获奖演讲中提出了“热力学假说”——序列完全决定结构。 此后,人们一直在试图计算解决这个问题。 AlphaFold 2正是这个50年难题的解答。 AlphaFold 2 在 CASP14 盲测中展现出了惊人的准确度,其在所有靶标上的 GDT_TS 中位数达到了 92. 4,Cα 原子的 RMSD 中位数仅为 0. 96 Å。 相比之下,第二名的方法中位数误差高达 2. 8 Å,差距极其悬殊。 学术界普遍认定它解决了单链蛋白质结构预测问题,其预测精度已与实验结果不相上下。 这一突破也直接推动了 2024 年诺贝尔化学奖授予 Hassabis、Jumper 和 Baker。 AlphaFold 2的架构精髓:从进化信号到三维结构AlphaFold 2有三个核心输入:多序列比对(MSA)、配对表征和结构模板。
其中MSA最为关键,进化过程中共同突变的残基往往在三维空间中接触,由此可从进化信号推断空间关系。 配对表征则提供了一个“草稿板”,让模型显式建模残基对之间的交互——消融实验证明这是极其关键的。 结构模板则不那么重要,模型在无模板时表现几乎同样好。 从这些输入出发,模型构建两条表征轨道:MSA表征栈和配对表征栈,通过我们称之为EvoFormer的创新架构让两者交互。 EvoFormer基于注意力机制,但融入了大量领域知识的归纳偏置。 比如我们嵌入了尊重三角不等式的三角更新,在配对表征的交互中注入几何先验。 最后,通过另一个网络将表征映射到三维空间。 在AlphaFold 2中,这是用旋转和平移来参数化的,进一步注入了几何归纳偏置(尽管后来的 AlphaFold 3 发现这一步并非必需)。 AlphaFold 2 的成功还得益于其他创新机制,比如将模型末端的表征重新反馈回起点的迭代循环机制(Recycling),以及对下游应用至关重要的置信度预测(包括逐残基的 pLDDT 和残基对的 PAE 指标)。 整个架构集成了大约 10 到 15 个核心创意,其中每一个都足以单独支撑一篇优秀的论文。
AlphaFold 2 的突破还带来了一个更深远的影响。 正如计算机视觉领域中 ImageNet 催生了 AlexNet,进而演进出 Inception Score 和 FID 来加速生成模型迭代一样,在结构生物学中,PDB 数据集、CASP 评估以及作为“预测器(Oracle)”的 AlphaFold 2,共同构建起了“数据集 → 评估 → 预测器 → 生成器”的产业飞轮。 这些预测器不仅让我们能在算法上快速迭代,更能帮助我们从海量设计中进行筛选和排序,准确挑出最值得进入湿实验室验证的候选分子。 从预测到创造:Latent—X1与条件生成范式AlphaFold 2是“看”蛋白质的结构,但我们要“造”蛋白质。 药物设计可以表述为一个条件生成任务:给定靶点的序列和结构,生成一个与之高特异性结合的分子。 这种结合必须精确到原子层面,无论是氢键还是疏水相互作用都必须恰到好处。 在 Latent Labs,我们将靶点表示为原子坐标点云,并以此为条件,利用去噪扩散模型从高斯噪声中开始生成结合物,这便是 Latent—X1 的工作原理。 在去噪轨迹中,你可以清晰地观察到模型如何从一团混沌中逐步“雕刻”出精确的结合物结构。
我们完整的“设计-验证”流程如下:给定靶点→指定结合位点(残基级精确)→用Latent—X1生成结合物→用AlphaFold 2/3类模型交叉验证。 其中,在交叉验证环节,我们会重点观察预测结构与设计是否一致,并评估其置信度。 湿实验室验证环节至关重要。 在 Latent Labs 位于旧金山的实验室中,我们在人类细胞系(如肾细胞)上表达设计出的分子,并用绿色荧光进行标记,同时移入带有橙色染料的靶点。 一旦橙色信号被成功固定在细胞上,即宣告结合成功。 鉴于单个氨基酸的偏差就可能让所有心血付诸东流,湿实验验证是把好最后一关的铁律。 作为一款基础模型,Latent—X1 并未针对特定的生物药模态进行刻意优化,这反而赋予了它在多场景下的优异表现。 在纳米抗体(Nanobody)设计中,它成功命中了所有靶标,亲和力达到了纳摩尔甚至皮摩尔级别;在迷你结合蛋白(Mini-binder,包含 80-120 个氨基酸)的设计上,它同样全数命中基准靶标,亲和力挺进皮摩尔级,这已极其接近“药物级”的结合力。 发布时的对比数据也证实,Latent—X1 在亲和力和命中率上均明显超越了同期的其他模型。
Latent—X2:零样本设计药物级抗体2024年12月,我们发布了Latent—X2。 其核心突破在于零样本设计药物级抗体。 抗体是当今获批药物中最大的生物药类别,且仍在扩张。 我们证实,Latent—X2 可以从头针对从未见过的靶点设计抗体,并且在纳米抗体、单域抗体等多种抗体格式上均能保持高亲和力。 在药物相似性(Drug-likeness)方面,Latent—X2同样令人振奋。 好的药物分子需要热稳定性高(熔点高)、单体性好(不自聚集,便于高密度储存和运输)、产量高(制造成本低)、多反应性低(无脱靶效应)、疏水性低(不易聚集)。 传统上,这些属性的优化是一个“打地鼠”游戏:当你按下其中一个指标时,另一个指标就会随之恶化。 然而,由 Latent—X2 设计的分子中,有 47% 的候选物无需经历任何迭代优化,就能同时跨过所有关键指标的阈值,其整体水准已非常接近市面上现有的治疗性抗体。 更令人震撼的是环肽设计的对比实验。 我们在PHD2和KRAS两个靶点上,将Latent—X2仅10个设计与万亿级随机筛选库的结果对比:在PHD2上,10个设计的结合力比万亿级筛选的最优结果强两个数量级。
而在历史上被公认为“不可成药”的 KRAS 靶标上,这 10 个设计同样拿到了与万亿级筛选分庭抗礼的结合物。 在效率上,AI 计算仅耗时 1 天,后续实验室验证花费 4 周;而传统筛选则需要耗费 3 到 6 个月的时间,并吞噬大量的人力和试剂成本。 我们还在与外部合作伙伴进行离子通道抑制项目。 离子通道是介导神经元离子流的膜蛋白孔道,对镇痛药物具有重要意义,一直被认为是极具挑战性的靶标。 如今,Latent—X2 设计的环肽已成功阻断了人类 NAV1. 7 钠离子通道,成为了“用 AI 计算精度替代传统蛮力筛选”的经典范例。 Latent—Y:全球首个实验室验证的抗体设计智能体在Latent X系列模型的基础上,我们更进了一步,创建了智能体系统Latent—Y,这是全球首个实验室验证的抗体设计智能体,也是药物设计团队的“力量倍增器”。 在此我为大家演示它的具体工作流。 我们在提示框中输入一句简单的指令:“生成阻断人 IL-6 的纳米抗体。 ”接下来,智能体便开始独立接管后续流程: 整个过程中,智能体可以并行执行多个步骤,真正实现了研发效能的成倍放大。 实验室验证结果令人信服。
Reader Mode unavailable (could not extract clean content).
Want this in your inbox every morning?
Daily brief at your local 8am — bilingual EN/中文, free.
More from 雷峰网 AI
See more →
独家|前小米崔宝秋低调创业,揭开家庭机器人的最优解
Cui Baoqiu, former Xiaomi tech lead, has launched 'Ruoban Technology' focusing on home robotics, securing star-studded seed funding. His vision includes integrating AI-driven robots into smart homes, leveraging his extensive experience from Xiaomi and the open-source movement.


