Griffon é o primeiro LVLM de alta resolução (acima de 1K) com capacidade de localização, capaz de descrever tudo em uma área de seu interesse. Na versão mais recente, o Griffon suporta a co-referência de linguagem visual. Você pode inserir uma imagem ou algumas descrições. O Griffon se destaca em REC, detecção de objetos, contagem de objetos, localização visual/de frases e REG. Preço: Teste gratuito.