ハーバード大学とコロンビア大学、1600万組のタンパク質配列をオープンソース化！AlphaFold 2の訓練データの私有性の問題を解決

新智元

公開日AIニュース · 1 分で読めます · Sep 20, 2023

OpenProteinSet：オープンソースのタンパク質データセット

ハーバード大学やコロンビア大学などの研究機関が、1600万個のタンパク質多重配列アラインメント（MSA）と関連データを含む、OpenProteinSetというオープンソースのデータセットを発表しました。

このデータセットの公開により、DeepMindのAlphaFold 2のトレーニングデータが非公開であった問題が解決され、バイオインフォマティクスやタンパク質機械学習の分野に重要な貢献をもたらします。AlphaFold 2は、タンパク質構造予測の精度においてこの分野をリードしていますが、そのデータの非公開は他の研究者の進歩を妨げていました。

OpenProteinSetは、すべてのタンパク質データベースのタンパク質と様々なUniProtクラスタのデータを含んでおり、幅広いAIモデルのトレーニングに使用できます。この資源は、生物学、医薬品開発などの研究分野にとって非常に重要であり、関連研究の発展を促進するでしょう。

DeepMind、アルファフォールド3をオープンソース化：ノーベル化学賞受賞モデル、創薬を加速

Google DeepMindは先日、AlphaFold3のソースコードとモデルウェイトを予想外の発表で公開し、科学的発見と創薬を加速する可能性のある大きな進歩を示しました。この発表から数週間後、システムの開発者であるDemis Hassabis氏とJohn Jumper氏は、タンパク質構造予測への貢献により2024年ノーベル化学賞を受賞しました。前バージョンであるAlphaFold2と比較して、AlphaFold3の技術的能力は…

AlphaFold 3 深掘り：スタンフォード博士による機械学習エンジニア視点からの超詳細解説！

AlphaFold3（AF3）は、DeepMindチームによる最新のタンパク質、核酸、小分子の構造予測ツールです。単一のタンパク質配列とその複合体の構造を解明できる能力を備え、AF3は配列情報から3次元構造への変換を実現しました。そのアーキテクチャは、3つの主要なモジュールで構成されています。入力準備（配列の整理と、類似構造を持つ分子の検索）、表現学習（多層アテンション機構を用いた表現の更新）、構造予測（条件付き拡散モデルを用いた予測）です。AF3は、様々な分子を独自の数字に変換するという革新的な手法を採用しています。

Inceptive：前Google Brain、指令薬物時代のAGIエディター

Inceptiveは、大規模な生物学的ソフトウェア言語の学習を通じて、新規タンパク質や薬物の設計・生成を実現します。Inceptiveは、深層学習を創薬に応用することにより、プログラム可能で拡張可能な新薬開発を実現します。InceptiveのCEOであるJakob Uszkoreit氏は、LLMの計算資源の配分不足が効率低下の重要な要因であると指摘しています。

グーグルAlphaFoldモデル、生物分子とリガンド構造の予測で大きな進歩

AlphaFoldの最新バージョンは、タンパク質、核酸、PTMを含む分子の構造を予測できるようになり、リガンド、タンパク質、核酸の高精度な原子レベル予測を実現しました。抗体結合関連の問題では以前のバージョンを大幅に上回り、タンパク質-リガンド構造をより迅速かつ正確に予測できるため、複雑な生物学的メカニズムの理解と医療応用の加速に役立ちます。

AIニュース

ハーバード大学とコロンビア大学、1600万組のタンパク質配列をオープンソース化！AlphaFold 2の訓練データの私有性の問題を解決

新智元

関連AIニュースの推奨

DeepMind、アルファフォールド3をオープンソース化：ノーベル化学賞受賞モデル、創薬を加速

AlphaFold 3 深掘り：スタンフォード博士による機械学習エンジニア視点からの超詳細解説！

Inceptive：前Google Brain、指令薬物時代のAGIエディター

グーグルAlphaFoldモデル、生物分子とリガンド構造の予測で大きな進歩