DataGemma RIG é uma série de modelos Gemma 2 ajustados finamente, projetados para ajudar os grandes modelos de linguagem (LLMs) a acessar e integrar dados estatísticos públicos confiáveis do Data Commons. O modelo emprega um método de geração por recuperação, consultando a interface de linguagem natural existente do Data Commons por meio de consultas em linguagem natural, e anotando os dados estatísticos nas respostas. O DataGemma RIG foi treinado no TPUv5e usando JAX. Atualmente, é uma versão inicial, destinada principalmente a fins acadêmicos e de pesquisa, e não está pronto para uso comercial ou público.