OpenAI lance GPT-Vision, un modèle multimodal pour concurrencer Gemini de Google

站长之家

Publié leActualités IA · 1 minutes de lecture · Sep 20, 2023

OpenAI et Google: La course à l'IA multimodale

OpenAI s'apprête à lancer GPT-Vision, un modèle multimodal qui concurrencera Gemini de Google. GPT-Vision permettra à GPT-4 d'interagir avec les images de manière plus approfondie, générant du texte en lien avec leur contenu. Par ailleurs, OpenAI développe également Gobi, un modèle d'IA multimodal qui pourrait bien devenir GPT-5.

OpenAI prévoit d'annoncer de nouvelles fonctionnalités pour GPT-4 lors de sa conférence développeurs le 6 novembre. La compétition entre OpenAI et Google stimulera l'innovation dans le domaine de l'IA, au bénéfice des consommateurs.

La Coupe de l'America utilise l'IA pour rendre le vent « visible »

Lors de la 37e Coupe de l'America, le programme WindSightIQ a été introduit pour la première fois à la télévision. Grâce à la technologie Lidar, à la fusion de capteurs et au calcul scientifique, il visualise le champ de vent sous forme de graphiques de réalité augmentée et de réalité virtuelle, aidant les spectateurs à comprendre les facteurs clés du vent dans la navigation à voile. Bien que les navigateurs dépendent toujours de leur intuition et de leur entraînement pour planifier leur itinéraire, les commentateurs et les spectateurs peuvent désormais voir en temps réel les schémas de vent, comparer les performances réelles au meilleur itinéraire, et ainsi participer à la course à un niveau sans précédent. Cette innovation offre une expérience de visionnage totalement nouvelle, rendant visible le vent, un élément généralement invisible.

Actualités IA

OpenAI lance GPT-Vision, un modèle multimodal pour concurrencer Gemini de Google

站长之家

Recommandations d'actualités IA connexes

La Coupe de l'America utilise l'IA pour rendre le vent « visible »