Google a annoncé récemment la réactivation de la fonctionnalité de génération d'images de personnages pour son chatbot IA Gemini. Cette décision fait suite à la suspension controversée de cette fonctionnalité plus tôt cette année, en raison d'informations historiquement inexactes. Selon la déclaration de Google, une version d'accès anticipé sera disponible dans les prochains jours pour les utilisateurs de Gemini Advanced, Business et Enterprise, et pour le moment, elle ne prend en charge que l'anglais.

Cette mise à niveau est alimentée par le dernier générateur d'images à partir de texte IA de Google, Imagen3. Initialement lancé discrètement début juin via AI Test Kitchen, Imagen3 est désormais intégré à toutes les versions linguistiques de Gemini. L'outil amélioré est capable de générer une variété de contenus, allant de paysages photo-réalistes à des peintures à l'huile texturées, le tout à partir de « quelques mots » de description.

Femme, portrait noir et blanc

Dave Citron, directeur principal de la gestion des produits Google Gemini, a déclaré que le nouveau modèle Imagen3 est doté de mesures de sécurité intégrées et qu'il offre « de meilleures performances que les autres modèles de génération d'images disponibles ». Pour éviter les problèmes d'inexactitudes historiques survenus précédemment, Google a optimisé le modèle afin de garantir que les images générées soient plus précises et appropriées.

Il est important de noter que cette fonctionnalité de Gemini diffère de la nouvelle fonctionnalité Remagine de Google, qui est spécifiquement conçue pour intégrer des éléments IA aux photos prises avec la série de téléphones Pixel 9.

Pour renforcer la sécurité du contenu, Gemini n'autorise pas les utilisateurs à créer des images réalistes de personnalités publiques, de contenu impliquant des mineurs, ou de scènes de sang, de violence ou à caractère sexuel. Citron a admis : « Bien sûr, chaque image créée par Gemini n'est pas parfaite, mais nous continuerons à recueillir les commentaires des utilisateurs early access de Gemini Advanced pour améliorer constamment le système. »

Google prévoit d'étendre la capacité de génération d'images de personnages IA à davantage d'utilisateurs et de versions linguistiques à l'avenir, afin de répondre aux besoins des utilisateurs du monde entier. Cette initiative témoigne non seulement des progrès de Google en matière de technologie de génération d'images IA, mais aussi de la détermination de l'entreprise à relever les défis éthiques et de sécurité liés à cette technologie.