O PaliGemma 2 é a segunda geração de modelos de linguagem visual da família Gemma, expandindo o desempenho e adicionando capacidades visuais. Isso permite que o modelo veja, entenda e interaja com entradas visuais, abrindo novas possibilidades. Construído com base no modelo Gemma 2 de alto desempenho, o PaliGemma 2 oferece vários tamanhos de modelo (3B, 10B, 28B de parâmetros) e resoluções (224px, 448px, 896px) para otimizar o desempenho em qualquer tarefa. Além disso, o PaliGemma 2 demonstra desempenho superior em reconhecimento de fórmulas químicas, reconhecimento de partituras musicais, raciocínio espacial e geração de relatórios de raios-X de tórax. O PaliGemma 2 visa fornecer aos usuários existentes do PaliGemma um caminho de atualização fácil, atuando como uma substituição plug-and-play, com melhorias de desempenho em muitas tarefas sem a necessidade de alterações significativas no código.