OpenAI ha anunciado la esperada función de videollamada y pantalla compartida para su modo de voz avanzado.
Esta nueva función ya está disponible para los usuarios de ChatGPT Teams, Plus y Pro en las aplicaciones móviles iOS y Android. Se espera que llegue a los suscriptores de ChatGPT para empresas y educación en enero del próximo año. Sin embargo, los usuarios de la Unión Europea, Suiza, Islandia, Noruega y Liechtenstein no podrán acceder a este modo de voz avanzado.
OpenAI mencionó esta función por primera vez en mayo de este año, mostrando cómo GPT-4 podía "ver" un juego y explicar su desarrollo. El modo de voz avanzado se lanzó oficialmente en septiembre. Los usuarios pueden iniciar una videollamada a través de un nuevo botón en la pantalla del modo de voz avanzado. Similar a FaceTime, ChatGPT responde en tiempo real a lo que el usuario muestra en el video.
En la demostración de OpenAI, ChatGPT ayudó a un usuario a preparar café usando la función de video. Pudo identificar los utensilios de café, guiar al usuario sobre cuándo colocar el filtro y evaluar el resultado. Además, ChatGPT también pudo recordar a la persona que se presentó, mostrando una mayor interactividad. Esta interacción por video es similar al reciente Project Astra de Google, que también responde a preguntas sobre objetos vistos durante una videollamada, como identificar esculturas en las calles de Londres.
La función de pantalla compartida permite a ChatGPT ir más allá de la aplicación y acceder al entorno del navegador. Los usuarios solo necesitan abrir la pantalla compartida a través del menú de tres puntos para abrir una aplicación en su teléfono y pedirle a ChatGPT ayuda sobre lo que ve. En la demostración, los investigadores de OpenAI activaron la pantalla compartida, abrieron una aplicación de mensajería y pidieron a ChatGPT ayuda para responder a un mensaje con foto.
Sin embargo, la función de pantalla compartida de ChatGPT se asemeja a funciones similares lanzadas recientemente por Microsoft y Google. La semana pasada, Microsoft lanzó una versión preliminar de Copilot Vision, que permite a los suscriptores Pro abrir el chat de Copilot mientras navegan por la web, pudiendo identificar fotos en páginas web o ayudar en juegos de adivinanzas de mapas. El Project Astra de Google también puede leer el contenido del navegador de forma similar.
Además, OpenAI ha lanzado un divertido "modo Papá Noel", donde los usuarios pueden conversar con un ChatGPT que imita la voz de Papá Noel.
A diferencia de las restricciones de la nueva función, el "modo Papá Noel" está disponible en la aplicación móvil, la versión web y las aplicaciones de Windows y MacOS hasta principios de enero del próximo año. Cabe destacar que las conversaciones con Papá Noel no se guardarán en el historial de chat ni afectarán la memoria de ChatGPT.
Puntos clave:
🎥 Nueva función de videollamada: ChatGPT responde en tiempo real a lo que el usuario ve.
🖥️ Función de pantalla compartida: los usuarios pueden pedir ayuda a ChatGPT desde su teléfono.
🎅 Modo "Papá Noel": los usuarios pueden interactuar con un ChatGPT que imita la voz de Papá Noel.