PaliGemma 2, Gemma परिवार का दूसरा पीढ़ी का दृश्य भाषा मॉडल है, जिसने प्रदर्शन को बढ़ाया है और दृश्य क्षमताओं को जोड़ा है, जिससे मॉडल दृश्य इनपुट को देख सकता है, समझ सकता है और उससे बातचीत कर सकता है, जिससे नई संभावनाएँ खुलती हैं। PaliGemma 2 उच्च-प्रदर्शन Gemma 2 मॉडल पर आधारित है, जो किसी भी कार्य के प्रदर्शन को अनुकूलित करने के लिए कई मॉडल आकार (3B, 10B, 28B पैरामीटर) और रिज़ॉल्यूशन (224px, 448px, 896px) प्रदान करता है। इसके अलावा, PaliGemma 2 ने रासायनिक सूत्र पहचान, संगीत स्कोर पहचान, स्थानिक तर्क और छाती एक्स-रे रिपोर्ट पीढ़ी जैसे क्षेत्रों में अग्रणी प्रदर्शन दिखाया है। PaliGemma 2 का उद्देश्य मौजूदा PaliGemma उपयोगकर्ताओं के लिए एक सुविधाजनक उन्नयन पथ प्रदान करना है, एक प्लग-एंड-प्ले प्रतिस्थापन के रूप में, अधिकांश कार्यों के लिए प्रदर्शन में वृद्धि प्राप्त करने के लिए कोड में बड़े बदलाव की आवश्यकता नहीं होती है।