先日、Arc InstituteとNVIDIAは、スタンフォード大学、カリフォルニア大学バークレー校、カリフォルニア大学サンフランシスコ校の研究者らと協力し、世界最大の生物学的AIモデル「Evo2」を発表しました。このモデルは12万8000個以上のゲノムデータ、9.3兆個ものヌクレオチドを基にトレーニングされており、その規模は最強の生成系AI言語モデルに匹敵します。

QQ_1740017835097.png

Evo2の深層学習能力により、異なる生物体の遺伝子配列のパターンを迅速に識別できます。研究者は長年を費やす必要がなくなりました。このモデルは、ヒトの疾患を引き起こす変異を正確に識別し、単純なバクテリアのゲノム長に匹敵する新しいゲノムを設計する能力を持っています。Evo2開発チームは、2025年2月19日にモデルの詳細を発表し、ユーザーフレンドリーなインターフェース「Evo Designer」を導入すると述べています。Evo2のコードはArcのGitHubで公開されており、NVIDIAのBioNeMoフレームワークに統合され、科学研究の進歩を促進します。

前世代のモデルEvo1と比較して、Evo2はデータ範囲を拡大し、バクテリア、古細菌、ウイルス、ヒト、植物などの真核生物のデータを含んでいます。研究者らは、Evo2の開発は生成生物学における重要な瞬間であり、機械がヌクレオチドの「読み書き、思考」を可能にしたと述べています。

技術面では、Evo2はNVIDIA DGX Cloud AIプラットフォームでトレーニングされ、2000台以上のNVIDIA H100 GPUを使用しました。このモデルは最大100万個のヌクレオチドの遺伝子配列を一度に処理でき、ゲノムの遠隔部分間の関係を理解できます。新しいAIアーキテクチャ「StripedHyena2」により、Evo2はEvo1より30倍多くのデータを処理できます。

Evo2の応用範囲は広く、タンパク質機能や生物の適応性関連の遺伝的変化の分析において優れた性能を発揮します。乳がん関連遺伝子BRCA1の変異テストでは、Evo2の変異予測精度は90%を超えました。これらの発見は、実験室の時間と費用を大幅に削減し、新薬の開発を促進します。

さらに、Evo2は新しいバイオツールや治療法の設計にも役立ちます。例えば、科学者は特定の細胞を標的とする遺伝子療法を設計し、副作用を回避できます。研究チームは、将来的にはEvo2を基に、より具体的なAIモデルを構築し、ゲノム研究と生物工学により多くの可能性を提供できると考えています。

倫理的および安全上のリスクに関して、研究者らは、Evo2のデータセットにヒトやその他の複雑な生物に有害な病原体は含まれていないことを確認し、この技術を責任ある開発と展開をしています。

Evo2詳細情報:https://arcinstitute.org/news/blog/evo2

要点:

🌱 Evo2は世界最大の生物学的AIモデルであり、12万8000個以上のゲノムデータでトレーニングされています。

🔍 このモデルは、疾患変異を迅速に識別し、新しいゲノムを設計することで、研究効率を大幅に向上させます。

💡 Evo2は、将来の生物工学と遺伝子療法の設計に新たな可能性をもたらします。