精密医療とバイオマーカー発見の波の中で、非標的メタボロミクスは極めて重要な役割を果たしています。しかし、既存のスペクトル参照ライブラリの不完全性により、化合物の同定は依然として課題となっています。この問題を解決するために、ドイツ連邦材料試験研究所(BAM)とベルリン自由大学の研究チームは共同で、FIORAというオープンソースのグラフニューラルネットワーク(GNN)を開発しました。これはタンデム質量分析のプロセスをシミュレートし、質量スペクトル同定の精度向上を目指しています。

FIORAモデルの中核は、分子の結合の局所的な近傍情報を利用して、化合物のフラグメンテーションパターンを学習し、フラグメントイオンの確率を推定することにあります。従来のフラグメンテーションアルゴリズムであるICEBERGやCFM-IDと比較して、FIORAは質量予測において優れた性能を示し、保持時間(RT)や衝突断面積(CCS)などの他の特性も予測できます。この画期的な研究成果は、2025年3月7日に『Nature Communications』に掲載されました。

image.png

FIORAは高性能GPUを最大限に活用して、推定された化合物のアノテーションを迅速に検証し、高品質な予測によりスペクトル参照ライブラリを大幅に拡張します。この進歩は、特に未知の化合物の分析において、非標的メタボロミクスの研究を推進する上で重要な意味を持ちます。過去10年間、高品質な参照スペクトルの不足により、この分野の研究は遅々として進みませんでした。例えば、2016年のCASMIチャレンジでは、コンピュータシミュレーション法の再現率はわずか34%であり、2022年には30%に達しませんでした。これは、新たな解決策が切実に求められていることを示しています。

FIORAの独自性は、各化合物の局所構造に基づいて、結合解離事象を個別に評価できる点にあります。この方法は、多くの既存アルゴリズムよりも質量スペクトルにおける物理的なフラグメンテーションプロセスを直接的にシミュレートします。さらに、FIORAは類似化合物に対する性能だけでなく、未知の構造への一般化能力も高く評価されています。

有効性を確認するために、FIORAは複数のデータセットでテストされ、その結果、予測された質量スペクトルと参照スペクトルの類似度の中央値は0.8以上であり、場合によっては競合アルゴリズムよりも10%から49%も高いことが示されました。さらに、FIORAのモジュール式設計により、さまざまな予測ターゲットに柔軟に対応でき、優れた多機能性を備えています。

FIORAの登場は、質量スペクトル分析における空白を埋めるだけでなく、将来の化合物同定と研究のための強力なツールを提供します。