Im Zuge des Aufschwungs von Präzisionsmedizin und der Entdeckung von Biomarkern spielt die untargette Metabolomik eine entscheidende Rolle. Die Identifizierung von Verbindungen bleibt jedoch aufgrund unvollständiger Referenzbibliotheken für Spektren eine Herausforderung. Um dieses Problem zu lösen, haben das Bundesanstalt für Materialforschung und -prüfung (BAM) und die Freie Universität Berlin gemeinsam FIORA entwickelt, ein Open-Source-Graph Neural Network (GNN), das den Prozess der Tandem-Massenspektrometrie simuliert und die Genauigkeit der Massenspektrenidentifizierung verbessert.

Das Herzstück des FIORA-Modells liegt in der Nutzung lokaler Nachbarschaftsinformationen von Bindungen in Molekülen, um Fragmentierungsmuster zu lernen und so die Wahrscheinlichkeit von Fragment-Ionen abzuleiten. Im Vergleich zu traditionellen Fragmentierungsalgorithmen wie ICEBERG und CFM-ID zeigt FIORA eine überragende Leistung bei der Massenvorhersage und kann auch andere Merkmale wie Retentionszeit (RT) und Kollisionsquerschnitt (CCS) vorhersagen. Diese bahnbrechende Forschungsarbeit wurde am 7. März 2025 in „Nature Communications“ veröffentlicht.

image.png

FIORA nutzt Hochleistungs-GPUs optimal aus, um die vermuteten Verbindungsanmerkungen schnell zu verifizieren und erweitert die Spektrenreferenzbibliothek durch qualitativ hochwertige Vorhersagen erheblich. Dieser Fortschritt ist von großer Bedeutung für die Weiterentwicklung der untargetten Metabolomik, insbesondere bei der Analyse unbekannter Verbindungen. In den letzten zehn Jahren hat sich die Forschung in diesem Bereich aufgrund des Mangels an hochwertigen Referenzspektren nur langsam entwickelt. Beispielsweise zeigte der CASMI-Wettbewerb 2016 eine Rückrufrate von nur 34 % für computergestützte Simulationsmethoden, während 2022 sogar weniger als 30 % erreicht wurden. Dies zeigt den dringenden Bedarf an einer neuen Lösung.

Das Besondere an FIORA ist seine Fähigkeit, Bindungsdissoziationsereignisse unabhängig für jede Verbindungsstruktur zu bewerten. Dieser Ansatz simuliert den physikalischen Fragmentierungsprozess in der Massenspektrometrie direkter als viele bestehende Algorithmen. Darüber hinaus zeichnet sich FIORA nicht nur durch seine hervorragende Leistung bei ähnlichen Verbindungen aus, sondern auch durch seine beeindruckende Generalisierbarkeit auf unbekannte Strukturen.

Um die Wirksamkeit zu gewährleisten, wurde FIORA an mehreren Datensätzen getestet. Die Ergebnisse zeigen, dass die Ähnlichkeit der vorhergesagten Massenspektren mit den Referenzspektren einen Median von über 0,8 erreicht, in einigen Fällen sogar 10 % bis 49 % höher als bei konkurrierenden Algorithmen. Darüber hinaus ermöglicht das modulare Design von FIORA eine flexible Anpassung an verschiedene Vorhersageziele und zeigt eine bemerkenswerte Vielseitigkeit.

Die Einführung von FIORA schließt nicht nur eine Lücke in der Massenspektrometrieanalyse, sondern bietet auch ein leistungsstarkes Werkzeug für die zukünftige Verbindungsidentifizierung und -forschung.