En la creciente ola de la medicina de precisión y el descubrimiento de biomarcadores, la metabolómica no dirigida juega un papel crucial. Sin embargo, la identificación de compuestos sigue siendo un desafío debido a la incompletitud de las bibliotecas de referencia de espectros existentes. Para abordar este problema, un equipo de investigación del Instituto Federal Alemán de Materiales y Pruebas (BAM) y la Universidad Libre de Berlín ha desarrollado conjuntamente FIORA, una red neuronal gráfica (GNN) de código abierto diseñada para simular el proceso de espectrometría de masas en tándem y ayudar a mejorar la precisión de la identificación de espectros de masas.
El núcleo del modelo FIORA radica en su capacidad para utilizar la información del entorno local de los enlaces en una molécula para aprender los patrones de fragmentación de los compuestos y, por lo tanto, derivar la probabilidad de iones fragmentados. En comparación con los algoritmos de fragmentación tradicionales ICEBERG y CFM-ID, FIORA muestra un rendimiento superior en la predicción de masas y puede predecir otras características como el tiempo de retención (RT) y la sección transversal de colisión (CCS). Este innovador resultado de investigación se publicó el 7 de marzo de 2025 en Nature Communications.
FIORA está diseñado para aprovechar al máximo las GPU de alto rendimiento, verificando rápidamente las anotaciones de compuestos propuestas y expandiendo significativamente las bibliotecas de referencia espectral a través de predicciones de alta calidad. Este avance es de gran importancia para impulsar la investigación en metabolómica no dirigida, especialmente en el análisis de compuestos desconocidos. En los últimos diez años, el progreso en este campo ha sido lento debido a la escasez de espectros de referencia de alta calidad. Por ejemplo, el desafío CASMI de 2016 mostró una tasa de recuperación de solo el 34% para los métodos de simulación por computadora, mientras que en 2022 no llegó al 30%. Esto indica la urgente necesidad de una nueva solución.
La singularidad de FIORA reside en su capacidad para evaluar de forma independiente los eventos de disociación de enlaces según la estructura local de cada compuesto. Este método simula el proceso físico de fragmentación en la espectrometría de masas de forma más directa que muchos algoritmos existentes. Además, FIORA no solo se destaca en compuestos similares, sino que también muestra una impresionante capacidad de generalización para estructuras desconocidas.
Para asegurar su eficacia, FIORA se probó en múltiples conjuntos de datos, mostrando que la similitud mediana de sus espectros de masas predichos con los espectros de referencia alcanza 0.8 o más, incluso superando en algunos casos a los algoritmos de la competencia en un 10% a un 49%. Además, el diseño modular de FIORA le permite adaptarse flexiblemente a diferentes objetivos de predicción, mostrando una notable versatilidad.
El lanzamiento de FIORA no solo llena un vacío en el análisis de espectrometría de masas, sino que también proporciona una herramienta poderosa para la futura identificación e investigación de compuestos.