Na onda da medicina de precisão e da descoberta de biomarcadores, a metabolômica não direcionada desempenha um papel crucial. No entanto, devido à incompletude dos bancos de dados de espectros de referência existentes, a identificação de compostos ainda enfrenta desafios. Para resolver esse problema, uma equipe de pesquisa do Instituto Federal Alemão de Materiais e Testes (BAM) e da Universidade Livre de Berlim desenvolveu o FIORA, uma rede neural gráfica (GNN) de código aberto, projetada para simular o processo de espectrometria de massas em tandem, ajudando a melhorar a precisão da identificação de espectros de massas.

O núcleo do modelo FIORA reside em sua capacidade de utilizar informações de vizinhança local das ligações em uma molécula para aprender os padrões de fragmentação do composto e, assim, derivar a probabilidade de íons fragmentados. Em comparação com os algoritmos de fragmentação tradicionais ICEBERG e CFM-ID, o FIORA apresenta desempenho superior na previsão de massa e pode prever outras características, como tempo de retenção (RT) e seção transversal de colisão (CCS). Este resultado inovador foi publicado em 7 de março de 2025, na revista Nature Communications.

image.png

O design do FIORA aproveita ao máximo as GPUs de alto desempenho, validando rapidamente as anotações de compostos propostas e expandindo significativamente os bancos de dados de referência espectrais por meio de previsões de alta qualidade. Este avanço é de grande importância para impulsionar a pesquisa em metabolômica não direcionada, especialmente na análise de compostos desconhecidos. Nas últimas décadas, o progresso na área foi lento devido à escassez de espectros de referência de alta qualidade. Por exemplo, o desafio CASMI de 2016 mostrou uma taxa de recuperação de apenas 34% para métodos de simulação por computador, e em 2022, esse número não chegou a 30%. Isso demonstra a urgente necessidade de uma nova solução.

A singularidade do FIORA reside em sua capacidade de avaliar independentemente os eventos de dissociação de ligação com base na estrutura local de cada composto. Este método simula o processo físico de fragmentação na espectrometria de massas de forma mais direta do que muitos algoritmos existentes. Além disso, o FIORA não apenas se destaca ao lidar com compostos semelhantes, mas também demonstra uma impressionante capacidade de generalização para estruturas desconhecidas.

Para garantir sua eficácia, o FIORA foi testado em vários conjuntos de dados, mostrando que a similaridade mediana entre os espectros de massas previstos e os espectros de referência atingiu 0,8 ou mais, superando os algoritmos concorrentes em 10% a 49% em alguns casos. Além disso, o design modular do FIORA permite que ele se adapte flexivelmente a diferentes objetivos de previsão, demonstrando uma notável versatilidade.

O lançamento do FIORA não apenas preenche uma lacuna na análise de espectrometria de massas, mas também fornece uma ferramenta poderosa para a identificação e pesquisa de compostos futuros.