Kosmos-2
Modelo de linguagem de grande porte multimodal voltado para o mundo
Produto ComumProdutividadeProcessamento de Linguagem NaturalMultimodal
Kosmos-2 é um modelo de linguagem de grande porte multimodal que pode associar linguagem natural com entradas de várias formas, como imagens e vídeos. Pode ser usado em tarefas como localização de frases, compreensão de referências, geração de referências, descrição de imagens e perguntas e respostas visuais. O Kosmos-2 utiliza o conjunto de dados GRIT, que contém um grande número de pares imagem-texto, usados para treinamento e avaliação do modelo. A vantagem do Kosmos-2 reside na sua capacidade de associar linguagem natural com informações visuais, melhorando assim o desempenho do modelo.
Kosmos-2 Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34