前 Meta 工程师创立的人工智能研究实验室 EvolutionaryScale 最近推出了 ESM3,一种具有原生多模式和生成语言模型的生物程序设计工具。
这种模型可根据特定提示来设计新蛋白质。实验结果表明,该模型能够生成一种新的绿色荧光蛋白(esmGFP),而这种蛋白质如果按照自然演化的速度来进行研究,需要耗费数亿年的时间。
EvolutionaryScale 已经完成了一轮1420万美元的种子轮融资,由 Nat Friedman、Daniel Gross 和 Lux Capital 领投,AWS 和英伟达的风险投资部门也参与了投资。ESM3共有三种规格,最小的版本已经公开发布,而中等和大型版本则通过 EvolutionaryScale 的 API 进行商业化运营。
为什么 EvolutionaryScale 在生物领域引入人工智能?虽然生成式人工智能模型在理解和推理人类语言方面已经取得了重大进展,但许多人想知道我们是否可以训练这些模型来解读生命的核心语言,然后使用它们来开发新型分子。生命的核心分子,包括 RNA、蛋白质和 DNA,是通过自然化学反应在过去35亿年中不断演化而来的。因此,能够编程生物并设计新分子的方法可能为解决人类面临的一些最大挑战,包括气候变化、塑料污染和癌症等条件,铺平道路。
下图所示的第一个盘子中,我们很感兴趣地找到了 B8。虽然非常暗淡,比天然GFP暗50倍,但它与任何已知的GFP相去甚远 - 其43%的序列与最接近的天然蛋白质不同。 在下面第二个板上继续B8的思路,ESM3发现了C10,它与天然荧光蛋白相似。
多个组织,包括 Google Deepmind 和 Isomorphic Labs,已经在这一领域开展了工作,EvolutionaryScale 是最新加入的一员。该公司在2023年成立,最近几个月开发了几个蛋白质语言模型,但其最新产品 ESM3是其中最大的,且具有原生多模式和生成式。
划重点:
💡 前 Meta 工程师创立的 EvolutionaryScale 推出了 ESM3,一种具有原生多模式和生成语言模型的生物程序设计工具。
💡 ESM3在测试中生成了一种新的绿色荧光蛋白,相当于模拟了超过5亿年的进化历程,对生物领域有巨大的应用潜力。
💡 ESM3共有三种规格,最小的版本已经公开发布,而中等和大型版本则通过 EvolutionaryScale 的 API 进行商业化运营。