哈佛、哥大开源1600万组蛋白质序列，解决AlphaFold 2训练数据私有难题！

新智元

发布于AI新闻资讯 · 1 分钟阅读 · 2023年9月20号 13:41

哈佛大学和哥伦比亚大学等研究机构发布了名为OpenProteinSet的开源数据集，包含1600万个蛋白质多序列对齐（MSA）和相关数据。这一数据集的推出解决了DeepMind的AlphaFold 2训练数据私有化的问题，为生物信息学和蛋白质机器学习领域提供了重要支持。AlphaFold 2的蛋白质结构预测准确性引领了该领域，但其私有数据限制了其他研究者的进展。OpenProteinSet包含了所有蛋白质数据库的蛋白质和各种UniProt集群的数据，可用于广泛的AI模型训练。这一资源对于研究生物学、药物研发等领域具有重要意义，将推动相关研究的发展。

谷歌DeepMind开源AlphaFold3：诺奖化学模型，助力药物研发！

谷歌 DeepMind 近日意外发布了 AlphaFold3的源代码和模型权重，标志着一个可能加速科学发现和药物开发的重大进展。这一消息传出仅几周后，系统的创造者 Demis Hassabis 和 John Jumper 便获得了2024年诺贝尔化学奖，以表彰他们在蛋白质结构预测方面的贡献。与前一版本 AlphaFold2相比，AlphaFold3的技术能力有了质的飞跃。AlphaFold2只能预测蛋白质的结构，而 AlphaFold3则可以建模蛋白质、DNA、RNA 及小分子之间复杂的相互作用，这是生命的基本过程。这一进展至关重要，因为理解这些分子相互作用是现代药

深度解析AlphaFold 3：斯坦福博士带你从ML工程师视角看超详细图解！

AlphaFold3（AF3）是DeepMind团队的最新增强工具，用于预测蛋白质、核酸和小分子的结构。凭借能够解析单个蛋白质序列及其复合结构的能力，AF3实现了"食谱到三维结构"的转变。其架构由三项核心模块组成：输入准备梳理序列、检索具备相似结构的分子；表示学习运用多层注意力机制更新表征；结构预测通过条件扩散模型实现预测。AF3创造性地将各类分子转化为独特数值张量，仿佛给每个分子一个独一无二的"身份证"，并运用注意力机制捕捉分子间的互相关系。在预测层面，条件扩散模型从随机噪声开始，逐步构建结构预测。训练中多种损失函数和信心评估共同作用，提高了AF3的预测准确性和可靠性，实现自我反省与提升。AF3的可视化指导和先进架构，展示了人工智能在生物学领域预测模型的革命性进步。

谷歌AlphaFold模型实现重大突破,可预测生物分子和配体结构

["AlphaFold最新版本可以预测蛋白质、核酸、含PTM分子的结构","实现了对配体、蛋白质、核酸高精度原子级预测","在抗体结合相关问题上大幅超过早期版本","可以更快速准确地预测蛋白质-配体结构","有助于理解复杂生物机制,加速医疗应用"]

AI新闻资讯

哈佛、哥大开源1600万组蛋白质序列，解决AlphaFold 2训练数据私有难题！

新智元

相关AI新闻推荐

谷歌DeepMind开源AlphaFold3：诺奖化学模型，助力药物研发！

深度解析AlphaFold 3：斯坦福博士带你从ML工程师视角看超详细图解！

Inceptive:前Google大脑指令药物时代的AGI编辑器

谷歌AlphaFold模型实现重大突破,可预测生物分子和配体结构

AI新闻资讯

哈佛、哥大开源1600万组蛋白质序列，解决AlphaFold 2训练数据私有难题！

新智元

相关AI新闻推荐

​谷歌DeepMind开源AlphaFold3：诺奖化学模型，助力药物研发！

深度解析AlphaFold 3：斯坦福博士带你从ML工程师视角看超详细图解！

Inceptive:前Google大脑指令药物时代的AGI编辑器

谷歌AlphaFold模型实现重大突破,可预测生物分子和配体结构

谷歌DeepMind开源AlphaFold3：诺奖化学模型，助力药物研发！