最近、Arc InstituteとNvidiaが共同開発したEvo2生物AIモデルが正式に発表されました。この基礎モデルは10万種を超える生物のDNAデータに基づいており、生物学における様々な複雑な現象を深く解明することを目指しています。Evo2は、研究者たちが長年かけて発見できるようなパターンを異なる生物体の遺伝子配列から識別でき、疾患関連変異の識別能力を大幅に向上させ、単純なバクテリアと同等の全く新しいゲノムを設計することも可能です。

image.png

Evo2のトレーニングには93兆個を超えるヌクレオチドの処理が含まれており、前身であるEvo1をはるかに凌駕しています。開発チームはNvidiaとカリフォルニア州パロアルトにある非営利の生物医学研究機関であるArc Instituteに所属し、スタンフォード大学、カリフォルニア大学バークレー校、カリフォルニア大学サンフランシスコ校の研究者とも緊密に協力しています。Evo2は強力な計算能力を持つだけでなく、透明性と説明可能性の面でも積極的に取り組んでいます。科学研究をよりオープンにするために、研究チームはEvo2のトレーニングデータ、コード、モデルの重みを公開しており、これまでにない規模の完全にオープンソースの生物AIモデルとなっています。

image.png

Arc Instituteの共同創設者であり、UCバークレーの助教授であるPatrick Hsu氏は、Evo2の開発は生成生物学における重要なブレークスルーであると述べています。この技術により、機械はヌクレオチドの言語を「読む」、「書く」、「考える」ことができ、生物学研究の進歩を促進します。Evo2のトレーニング能力は大規模言語モデルに匹敵し、疾患変異の予測や潜在的な人工生命の設計において大きな可能性を示しています。

さらに、Evo2は特定の細胞タイプを活性化する遺伝子治療など、生物療法の設計に新たなアイデアを提供し、副作用を軽減し、治療の精度を高めることができます。Evo2の開発は技術的なブレークスルーであるだけでなく、生物学への理解にも深い影響を与えています。

研究者たちはモデルの責任ある開発を確保するために、ヒトやその他の複雑な生物に感染する病原体のデータは意図的に除外しました。Nvidiaのデジタル生物学ディレクターであるAnthony Costa氏は、Evo2は生物基礎モデルの限界を突破し、世界中の科学者たちに、人類が直面する重大な健康と疾患の課題に対処するための強力な協働ツールを提供すると述べています。