A OpenAI está prestes a lançar um modelo multimodal chamado GPT-Vision, para competir com o Gemini do Google. O GPT-Vision permitirá que o GPT-4 tenha capacidades de imagem mais amplas, gerando texto relacionado ao conteúdo das imagens.
Além disso, a OpenAI está desenvolvendo um modelo de IA multimodal chamado Gobi, que pode se tornar o GPT-5. A OpenAI planeja anunciar novos recursos do GPT-4 em sua conferência para desenvolvedores em 6 de novembro.
A competição entre a OpenAI e o Google impulsionará o avanço da tecnologia de IA, beneficiando os consumidores.