Uma pesquisa liderada por pesquisadores da Universidade Mohamed bin Zayed resultou em um modelo de inteligência artificial chamado BiMediX2. Este sistema consegue entender e interpretar informações em imagens médicas, com suporte para análise bilíngue em inglês e árabe, mostrando desempenho excepcionalmente superior no processamento de conteúdo árabe.
O BiMediX2 é o primeiro sistema de IA capaz de analisar e descrever imagens médicas em inglês e árabe. Ele pode processar diversos tipos de imagens médicas, incluindo raios-X, ressonâncias magnéticas e imagens microscópicas, fornecendo descrições detalhadas e respondendo a perguntas sobre o conteúdo da imagem. O modelo não apenas melhorou a precisão da tradução em imagens médicas, mas também aprimorou significativamente o processamento da língua árabe.
De acordo com o relatório técnico, o BiMediX2 se destacou em testes comparativos com tecnologias existentes. Sua eficácia na tradução de conteúdo inglês aumentou em 9%, enquanto a tradução de conteúdo árabe melhorou em 20%. Esse sucesso se deve ao treinamento massivo do modelo com 1,6 milhão de textos e imagens médicas, garantindo a conversão precisa entre as duas línguas.
O desempenho excepcional do BiMediX2 é resultado da inovação em sua arquitetura subjacente. O sistema é baseado na arquitetura Llama3.1 e GPT-4o, otimizados especificamente para a área médica. Combinado com o Vision Encoder e o Meta Llama3.1, o BiMediX2 realiza uma análise de imagens médicas bilíngues perfeita. Em testes, mostrou-se superior ao GPT-4o na identificação de informações médicas incorretas.
Apesar do desempenho animador do BiMediX2, os pesquisadores enfatizam que, atualmente, o sistema é restrito a uso em pesquisa e ainda não está disponível para aplicações clínicas. Como todos os sistemas de IA, o BiMediX2 pode cometer erros ou gerar informações imprecisas. Portanto, a equipe de pesquisa disponibilizou o modelo no Hugging Face e lançou um benchmark bilíngue chamado BiMed-MBench para testar o desempenho de sistemas similares.
O BiMediX2 representa uma inovação significativa na área de análise de imagens médicas, especialmente no processamento de imagens médicas bilíngues e na tradução. Embora ainda não esteja em uso clínico, os resultados da pesquisa apontam para um futuro com aplicações de IA mais eficientes e precisas no setor médico.