Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Al hardware

lista todos os produtos de hardware AI.

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas

VisRAG

Modelo de geração aprimorado por recuperação baseado em modelo de linguagem visual

Produto ComumImagemModelo de Linguagem VisualGeração Aprimorada por Recuperação

Abrir Site

VisRAG é um processo inovador de Geração Aprimorada por Recuperação (RAG) baseado em Modelo de Linguagem Visual (VLM). Diferentemente dos RAGs tradicionais baseados em texto, o VisRAG processa diretamente os documentos como imagens por meio de um VLM, para então recuperá-los e aprimorar a capacidade de geração do VLM. Este método maximiza a preservação das informações contidas nos documentos originais, eliminando a perda de informações introduzida durante o processo de análise. A aplicação do modelo VisRAG em documentos multimodais demonstra seu grande potencial em recuperação de informações e geração de texto aprimorada.

Abrir Site

VisRAG Situação do Tráfego Mais Recente

Total de Visitas Mensais

521149929

Taxa de Rejeição

35.96%

Média de Páginas por Visita

6.1

Duração Média da Visita

00:06:29

VisRAG Tendência de Visitas

VisRAG Distribuição Geográfica das Visitas

VisRAG Fontes de Tráfego

VisRAG Alternativas

VisRAG — Modelo de geração aprimorado por recuperação baseado em modelo de linguagem visual

Imagem

•Modelo de Linguagem Visual•Geração Aprimorada por Recuperação

228

ViDoRAG — ViDoRAG é uma estrutura de agente de raciocínio iterativo dinâmico que combina recuperação de documentos visuais com geração aprimorada.

Programação

•Multimodal•Geração Aprimorada por Recuperação

138

M2RAG — Repositório de código de benchmark para geração aprimorada por recuperação em contexto multimodal.

Programação

•Multimodal•Geração aprimorada por recuperação

SigLIP2 — O SigLIP2 é um codificador visual de linguagem multilíngue lançado pelo Google, usado para classificação de imagens de amostra zero.

Imagem

•Multilíngue•Classificação de amostra zero

180

VLM-R1 — O VLM-R1 é um modelo de linguagem visual reforçado estável e versátil, focado em tarefas de compreensão visual.

Imagem

•Modelo de Linguagem Visual•Aprendizado por Reforço

228

MiniRAG — Uma estrutura de geração aprimorada por recuperação simples, que permite que modelos pequenos alcancem bom desempenho RAG por meio de indexação de grafos heterogêneos e recuperação topologicamente aprimorada e leve.

Programação

•Geração Aprimorada por Recuperação•Modelos de Linguagem Pequenos

210

Ollama OCR para Web — Um poderoso pacote OCR que utiliza modelos de linguagem visual de última geração para extrair texto de imagens.

Imagem

•OCR•Reconhecimento de Imagem

396

Moondream AI — Modelo de linguagem visual de código aberto, executável em diversos dispositivos.

Outros

•Inteligência Artificial•Código Aberto

288

PaliGemma2-3b-pt-448 — PaliGemma 2 é um poderoso modelo de linguagem visual que suporta diversas tarefas de linguagem visual.

Programação

•Modelo de linguagem visual•Suporte multilíngue

186

cogagent-9b-20241220 — CogAgent-9B-20241220 é um modelo de agente de GUI baseado em modelo de linguagem visual.

Programação

•Modelo de Linguagem Visual•Agente de GUI

180

CogAgent — Agente GUI baseado em um modelo de linguagem visual (VLM) de ponta a ponta de código aberto.

Programação

•Modelo de Linguagem Visual•Agente GUI

360

c4ai-command-r7b-12-2024 — Modelo de geração de texto multilíngue com 7B parâmetros

Programação

•Geração de texto•Multilíngue

210

DeepSeek-VL2-Tiny — Modelo avançado de linguagem visual de grande porte e especialista híbrido

Imagem

•Modelo de Linguagem Visual•Especialista Híbrido

492

POINTS-Yi-1.5-9B-Chat — Avanço recente em modelos de linguagem visual, integrando novas tecnologias do WeChat AI.

Produtividade

•Modelo de Linguagem Visual•WeChat AI

198

POINTS-Qwen-2-5-7B-Chat — Avanços recentes em modelos de linguagem visual

Produtividade

•Modelo de linguagem visual•Multimodal

192

POINTS-1-5-Qwen-2-5-7B-Chat — Modelo de linguagem visual líder, suporta idiomas português e inglês com controle de alta qualidade, gratuito.

Produtividade

•Modelo de Linguagem Visual•Suporte Bilíngue (Português e Inglês)

144

DeepSeek-VL2 — Modelo avançado de compreensão multimodal que integra capacidades visuais e linguísticas.

Imagem

•Modelo de linguagem visual•Compreensão multimodal

576

Florence-VL — Ferramenta de aprimoramento de modelos de linguagem visual, combinando codificador visual generativo e técnica de fusão profunda e ampla.

Programação

•Modelo de Linguagem Visual•Aprendizado Multimodal

216

Qwen2-VL-7B — Qwen2-VL-7B é o mais recente modelo de linguagem visual, que suporta compreensão multimodal e geração de texto.

Imagem

•Modelo de linguagem visual•Multimodal

192

Qwen2-VL-2B — Modelo de linguagem visual de ponta, com suporte para compreensão multimodal e geração de texto.

Imagem

•Modelo de Linguagem Visual•Multimodal

174

PaliGemma 2 — O PaliGemma 2 é um poderoso modelo de linguagem visual, fácil de otimizar.

Produtividade

•Modelo de Linguagem Visual•IA

186

SmolVLM — Modelo de linguagem visual eficiente e de código aberto

Imagem

•Modelo de Linguagem Visual•IA Multimodal

222

LLaVA-o1 — Modelo de linguagem visual capaz de raciocínio passo a passo.

Produtividade

•Modelo de linguagem visual•Raciocínio passo a passo

228

Aquila-VL-2B-llava-qwen — Modelo de linguagem visual que combina informações de imagem e texto para processamento inteligente.

Imagem

•Modelo de Linguagem Visual•Multimodal

216

ROCKET-1 — Modelo de prompt de contexto visual-temporal que domina a interação em mundos abertos.

Programação

•Modelo de Linguagem Visual•Tomada de Decisão Embodied

174

OmniParser — Interpretador de interface gráfica do usuário baseado em visão pura

Produtividade

•Modelo de linguagem visual•Análise de interface de usuário

696

LightRAG — Modelo de geração aprimorado por recuperação, simples e rápido

Programação

•Processamento de Linguagem Natural•Geração Aprimorada por Recuperação

306

ColPali — Ferramenta de recuperação de documentos eficiente com modelo de linguagem visual

Produtividade

•Recuperação de documentos•Modelo de linguagem visual

192

Helpful DoggyBot — Sistema Operacional de Mobilidade Interna para Robô Quadrúpede

Produtividade

•Robô Quadrúpede•Manipulação Móvel

138

Nemotron-Mini-4B-Instruct — Modelo de linguagem pequeno para interpretação de papéis, geração aprimorada por recuperação e chamadas de função.

Produtividade

•Modelo de linguagem pequeno•Destilação

378