生物科学とコンピュータサイエンスの交差点において、AlphaFold3は発表以来、多くの注目を集めるスーパースターとなっています。しかし残念なことに、Google DeepMindは論文のみを発表し、コードやモデルの重みは公開していません。美味しいケーキを目の前に見せられても、味わうことができないようなものです。このような状況を受け、多くのチームがAlphaFold3の再現にしのぎを削っています。

この活況の中、Ligoというスタートアップ企業が頭角を現し、AlphaFold3を再現した最初のチームとなりました。驚くべきことに、このチームの3人の創設者は全員オックスフォード大学の学部生です。わずか4ヶ月でこの偉業を達成し、科学界に大きな貢献をしました。

QQ20240909-134914.jpg

AlphaFold3は、特にタンパク質構造予測において、生物科学分野の画期的な成果とみなされています。その応用範囲は計り知れません。しかし、DeepMindの戦略は、特定のサーバーでのみ利用可能で、1日の呼び出し回数も制限されているため、将来の商業利益を考慮しているように見え、やや失望を招いています。それでも、研究者たちは、この成果が医薬品開発のルールを一変させる可能性に期待を寄せています。

多くの科学者が挫折感を味わう中、Ligoチームは勇敢にも第一歩を踏み出しました。彼らはAlphaFold3のモデルを再現しただけでなく、それをオープンソース化し、より多くの人々が恩恵を受けられるようにする計画です。Ligoチームは、彼らのモデルは現在、タンパク質構造を効果的に予測でき、他の機能は近日中に追加されると述べています。

再現のプロセスは容易ではありませんでした。チームは、DeepMindの論文にあるモデルアーキテクチャをPyTorchコードに完全に変換しました。その過程で、損失関数の数式誤りなど、元の論文にいくつかの問題を発見しました。これはトレーニング結果に影響を与える可能性があります。さらに、勾配流を改善するために残差層を追加するなど、元のモデルを最適化しました。

エキサイティングなことに、Ligoチームはこの作業において、元のモデルの考え方に従うだけでなく、革新的な、より効率的な実装方法を試みました。彼らは、わずか8個のA100 GPUを使用してモデルを生成しました。その効率の高さは注目に値します。

DeepMindは商業上の理由から当面成果を非公開としていますが、Ligoによる成功した再現は人々に希望を与え、より多くのチームの追随を促しました。Ligoに加えて、コロンビア大学のOpenFoldチームや独立開発者のPhil Wangもこのオープンソース化運動に積極的に参加しており、活気のある研究生態系が形成されています。

プロジェクトアドレス:https://github.com/Ligo-Biosciences/AlphaFold3