伦敦初创公司Basecamp Research最近成功融资6000万美元,正在开发一个令人瞩目的生物学AI助手。这个项目不仅旨在回答与生物学和自然世界生物多样性相关的任何问题,更有望产生人类无法独立获得的新见解,为生物科技领域带来革命性突破。
Basecamp Research的联合创始人兼CEO Glen Gowers指出,当前生物学模型训练存在巨大的数据缺口。即使是全球顶尖的制药公司,其训练的模型也无法全面涵盖自然世界的复杂性。这一观点凸显了Basecamp Research项目的重要性和潜在影响。
图源备注:图片由AI生成,图片授权服务商Midjourney
公司的发展势头强劲。据Gowers透露,Basecamp Research已与25个国家的100多个组织建立了合作伙伴关系,以扩充其原始信息数据库。其中约15个组织正在利用其AI技术开发新产品。例如,宝洁公司正在使用这些模型设计酶,用于生产能在低温下清除污渍的洗涤剂;Colorifix则致力于开发更可持续的新型织物染料配方。
更引人注目的是,Basecamp Research声称其基础模型BaseFold在准确预测大型复杂蛋白质结构和小分子相互作用方面,表现优于刚刚获得诺贝尔化学奖的DeepMind公司的AlphaFold2模型。这一断言无疑为Basecamp Research的技术实力提供了有力佐证。
Basecamp Research采用了一种雄心勃勃的方法来构建生物学AI:从头开始构建模型。创始人Glen Gowers和Oliver Vince都拥有生物学博士学位,他们的合作始于牛津大学本科时期。公司名称"Basecamp Research"源于他们曾经在冰盖上生活的经历,当时他们使用自制硬件进行DNA测序。
Vince提到,他们开创了首个移动DNA测序实验室,并将该硬件的某些组件改造成小型单元,用于为新创公司收集数据。这种创新精神和实践经验为Basecamp Research奠定了坚实的技术基础。
尽管生物学领域已经积累了大量的研究成果和数据,但许多数据已经过时、结构混乱或不一致。因此,Basecamp Research正在通过一手收集原始数据来构建模型。他们的目标是开发出一个能比任何人类更深入洞察生物学的AI系统,这源于其能够处理和分析的海量数据。
Gowers解释道,他们将探索活动(如考察世界各地的温泉、火山等)与专注于训练大型语言模型的AI程序相结合,本质上是在打造一个"自然界的ChatGPT"。公司还建立了可能是目前最大的专门用于研究自然世界的计算集群。
与ChatGPT擅长回忆和构建自然语言响应类似,Basecamp Research的AI也具备这种能力。不同之处在于,由于我们对世界生物多样性的了解仅限于约1%,人类目前甚至无法提出正确的问题。正如投资者、前谷歌Verily生命科学公司CEO Andy Conrad所言,Basecamp Research的平台能够"解答生物制药行业尚未意识到需要提出的问题"。
Gowers进一步解释,他们的平台不仅理解文本或语音的语言,还能理解DNA和生物学的语言,因此能在生物设计领域超越人类的能力。传统上,人类在理解DNA方面存在局限,而这些语言模型如果获得足够的数据,就能在这一领域大显身手。
这轮B轮融资由欧洲公司Singular领投,同时Basecamp Research还宣布与David R. Liu博士和哈佛-麻省理工学院布罗德研究所展开多年合作。公司计划利用这笔资金继续扩大与其他生物医学和研究组织的合作,并收集更多数据来扩展其模型。
Basecamp Research的未来规划包括协助组织进行药物发现和其他涉及理解和更好利用自然世界的重大挑战。目前,Liu博士领导的实验室正在研究用于创造基因药物的"新型融合蛋白和其他大分子",并使用Basecamp Research的数据集来开发这些分子。
值得注意的是,Basecamp Research目前更倾向于专注B2B业务,而非开发面向普通公众的产品。这种策略似乎也是其他构建大型"科学"模型的公司所采用的方法,例如正在构建大型物理模型的Jua公司最初就针对需要更好洞察天气模式的组织。
虽然Basecamp Research没有披露具体估值,但表示这轮B轮融资是一轮上涨轮。公司迄今已筹集8500万美元,先前的投资者包括Hummingbird、True Ventures和战略投资者Valo。根据PitchBook的数据,公司在2022年的估值为7100万美元。
本轮融资还吸引了S32、redalpine、罗氏副董事长André Hoffmann、皇家飞利浦董事长兼前DSM CEO Feike Sijbesma以及前联合利华CEO Paul Polman等知名投资者的参与。