Dans le contexte de la médecine de précision et de la découverte de biomarqueurs, la métabolomique non ciblée joue un rôle crucial. Cependant, l'identification des composés reste un défi en raison de l'incomplétude des bibliothèques de référence spectrale existantes. Pour résoudre ce problème, une équipe de recherche de l'Institut fédéral allemand des matériaux et des essais (BAM) et de l'Université libre de Berlin a développé conjointement FIORA, un réseau neuronal graphique (GNN) open source visant à simuler le processus de spectrométrie de masse en tandem, afin d'améliorer la précision de l'identification par spectrométrie de masse.

Au cœur du modèle FIORA se trouve son utilisation des informations sur le voisinage local des liaisons dans les molécules pour apprendre les modes de fragmentation des composés et ainsi déduire la probabilité des fragments. Comparé aux algorithmes de fragmentation traditionnels ICEBERG et CFM-ID, FIORA excelle dans la prédiction de masse et est capable de prédire d'autres caractéristiques telles que le temps de rétention (RT) et la section efficace de collision (CCS). Ce résultat de recherche novateur a été publié le 7 mars 2025 dans Nature Communications.

image.png

FIORA est conçu pour tirer pleinement parti des GPU hautes performances, permettant une validation rapide des annotations de composés supposés et étendant considérablement les bibliothèques de référence spectrale grâce à des prédictions de haute qualité. Cette avancée est d'une importance capitale pour faire progresser la recherche en métabolomique non ciblée, notamment dans l'analyse de composés inconnus. Au cours des dix dernières années, la recherche dans ce domaine a progressé lentement en raison de la rareté des spectres de référence de haute qualité. Par exemple, le concours CASMI de 2016 a montré un taux de rappel de seulement 34 % pour les méthodes de simulation informatique, un taux qui n'a même pas atteint 30 % en 2022. Cela souligne le besoin urgent d'une nouvelle solution.

L'originalité de FIORA réside dans sa capacité à évaluer indépendamment les événements de dissociation des liaisons en fonction de la structure locale de chaque composé. Cette approche simule le processus physique de fragmentation en spectrométrie de masse de manière plus directe que de nombreux algorithmes existants. De plus, FIORA excelle non seulement avec des composés similaires, mais aussi par sa remarquable capacité de généralisation à des structures inconnues.

Pour garantir son efficacité, FIORA a été testé sur plusieurs ensembles de données, les résultats montrant une médiane de similarité supérieure à 0,8 entre les spectres de masse prédits et les spectres de référence, dépassant même les algorithmes concurrents de 10 % à 49 % dans certains cas. De plus, la conception modulaire de FIORA lui permet de s'adapter facilement à différentes cibles de prédiction, démontrant une remarquable polyvalence.

Le lancement de FIORA comble non seulement une lacune dans l'analyse par spectrométrie de masse, mais fournit également un outil puissant pour l'identification et la recherche futures de composés.