Em um recente seminário de TI da Gartner, analistas compartilharam uma previsão notável: até 2027, 40% das soluções de inteligência artificial generativa (IA Generativa) integrarão a multimodalidade, processando simultaneamente texto, imagens, áudio e vídeo. Isso representa um aumento significativo em comparação com 1% em 2023. Essa transformação terá um impacto profundo nas aplicações empresariais.
Fonte: Imagem gerada por IA, serviço de licenciamento de imagens Midjourney
Erick Brethenoux, vice-presidente sênior da Gartner, apontou que, à medida que o mercado de IA Generativa evolui para modelos multimodais, isso ajudará a capturar as relações entre diferentes fluxos de dados e poderá expandir os benefícios da IA Generativa em vários tipos de dados e aplicações. Ele enfatizou que a IA Generativa multimodal pode apoiar os humanos na execução de mais tarefas em diferentes ambientes.
De acordo com o relatório de ciclo de hype de tecnologia de inteligência artificial generativa da Gartner de 2024, a IA Generativa multimodal e os modelos de linguagem grandes (LLMs) de código aberto são considerados de altíssimo impacto, prevendo-se que tragam vantagens competitivas e maior rapidez de resposta ao mercado para as empresas nos próximos cinco anos. A Gartner também apontou que, na próxima década, modelos de IA Generativa específicos para determinados setores e agentes autônomos devem alcançar adoção generalizada.
O analista Arun Chandrasekaran mencionou que a navegação das empresas no ecossistema de IA Generativa será desafiadora, pois o ambiente tecnológico e de fornecedores muda rapidamente. Embora a IA Generativa esteja atualmente no "vale da decepção", os verdadeiros benefícios se tornarão evidentes após o declínio da euforia, com o início da consolidação do setor, e as melhorias de capacidade se acelerarão.
A transformação para a IA Generativa multimodal aprimorará os aplicativos empresariais, introduzindo novas funcionalidades. Atualmente, muitos modelos multimodais estão limitados a dois ou três modos, mas espera-se que essa diversidade aumente nos próximos anos. Brethenoux mencionou que, na vida real, as pessoas usam uma combinação de áudio, visual e sensação para entender informações, tornando a IA Generativa multimodal crucial.
Sobre os modelos de linguagem grandes de código aberto, Chandrasekaran apontou que eles oferecem às empresas potencial de inovação, reduzindo a dependência de fornecedores específicos por meio de personalização, controle de privacidade e segurança e transparência do modelo. Finalmente, os LLMs de código aberto podem fornecer modelos menores e mais fáceis de treinar, auxiliando os processos de negócios essenciais das empresas.
Os modelos de IA Generativa específicos para determinados setores são otimizados para indústrias ou tarefas específicas, podendo melhorar o alinhamento dos casos de uso internos e aumentar a precisão e a segurança. Chandrasekaran acrescentou que esses modelos permitem uma demonstração de valor mais rápida, melhor desempenho e maior segurança, incentivando as organizações a adotarem a IA Generativa em uma gama mais ampla de casos de uso.
Os sistemas de agentes autônomos podem atingir objetivos sem intervenção humana, usando tecnologia de IA para identificar padrões, tomar decisões e gerar resultados. Brethenoux destacou que os agentes autônomos representam um grande avanço na capacidade da IA, o que impulsionará a melhoria das operações de negócios e da experiência do cliente, podendo também levar a uma mudança no modo de trabalho dentro das organizações, de execução para supervisão.
Destaques:
🌟 Até 2027, 40% das soluções de inteligência artificial generativa integrarão a multimodalidade, um aumento significativo em relação a 2023.
🚀 A IA Generativa multimodal e os modelos de linguagem grandes de código aberto devem trazer vantagens competitivas significativas nos próximos cinco anos.
🔍 Os modelos de IA Generativa específicos para determinados setores podem aumentar a precisão e a segurança dos aplicativos empresariais, incentivando uma adoção mais ampla.