在精准医学与生物标志物发现的浪潮中,非靶向代谢组学扮演着至关重要的角色。然而,由于现有谱图参比库的不完整,化合物的鉴定依然面临挑战。为了解决这一问题,德国联邦材料研究与测试研究所(BAM)与柏林自由大学的研究团队联合开发了 FIORA,一种开源图神经网络(GNN),旨在模拟串联质谱的过程,帮助提高质谱识别的准确性。
FIORA 模型的核心在于它利用分子中键的局部邻域信息,学习化合物的断裂模式,从而推导出碎离子的概率。与传统的碎裂算法 ICEBERG 和 CFM-ID 相比,FIORA 在质量预测上表现优异,并能够预测如保留时间(RT)和碰撞截面(CCS)等其他特征。这一开创性的研究成果已于2025年3月7日发表在《Nature Communications》上。
FIORA 的设计充分利用了高性能 GPU,快速验证推定的化合物注释,并通过高质量的预测显著扩展了光谱参考库。这一进展对于推动非靶向代谢组学的研究具有重要意义,尤其是在对未知化合物进行分析时。过去十多年里,由于高质量参考谱的稀缺,该领域的研究进展缓慢。例如,2016年 CASMI 挑战赛显示,计算机模拟方法的召回率仅为34%,而2022年更是未达到30%。这表明迫切需要一种新的解决方案。
FIORA 的独特之处在于,它能够根据每个化合物的局部结构独立评估键解离事件。这种方法比许多现有算法更为直接地模拟质谱中的物理碎裂过程。此外,FIORA 不仅在针对相似化合物时表现出色,其对不熟悉结构的推广能力也令人印象深刻。
为确保其有效性,FIORA 在多个数据集上进行测试,结果显示其预测的质谱与参考谱的相似度中位数达到0.8以上,甚至在某些情况下比竞争算法高出10% 到49%。此外,FIORA 的模块化设计使其可以灵活适应不同的预测目标,展现了出色的多功能性。
FIORA 的推出不仅填补了质谱分析中的空白,更为未来的化合物鉴定与研究提供了强有力的工具。