PaliGemma
Modèle de langage visuel ouvert de pointe de Google
Nouveau Produit PremiumImageModèle de langage visuelCompréhension d'images
PaliGemma est un modèle de langage visuel avancé développé par Google. Il combine l'encodeur d'image SigLIP et le décodeur de texte Gemma-2B pour comprendre les images et le texte, et réalise une compréhension interactive image-texte grâce à un entraînement conjoint. Ce modèle est conçu pour des tâches spécifiques en aval telles que la description d'images, la question-réponse visuelle, la segmentation, etc., et constitue un outil important pour la recherche et le développement.
PaliGemma Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44