El 25 de septiembre, OpenAI lanzó funciones multimodales para su popular chatbot de IA, ChatGPT, incluyendo interacción por voz y reconocimiento de imágenes. Las nuevas funciones permiten a los usuarios interactuar a través de conversaciones de voz y la carga de imágenes, ofreciendo capacidades de reconocimiento de voz, reconocimiento de texto y detección de objetos. Esta versión multimodal de ChatGPT se llama GPT-4V, y se entrenó al mismo tiempo que GPT-4, aunque su lanzamiento se retrasó por motivos de seguridad. OpenAI indicó que las nuevas funciones se lanzarán primero para los suscriptores de ChatGPT Plus y los usuarios de la versión empresarial.
La función multimodales de OpenAI ChatGPT ya está disponible, admite interacción de voz y reconocimiento de imágenes
