Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Al hardware

lista todos os produtos de hardware AI.

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas

Show-o

Transformador único para compreensão e geração multimodal unificada

Produto ComumImagemInteligência ArtificialMultimodal

Abrir Site

Show-o é um modelo de transformador único para compreensão e geração multimodal, capaz de lidar com legendagem de imagens, perguntas e respostas visuais, geração de imagem a partir de texto, reparo e extensão guiados por texto, e geração multimodal híbrida. Desenvolvido conjuntamente pelo Show Lab da Universidade Nacional de Singapura e pela ByteDance, utiliza as mais recentes tecnologias de aprendizado profundo para compreender e gerar dados de múltiplas modalidades, representando um grande avanço na área da inteligência artificial.

Abrir Site

Show-o Situação do Tráfego Mais Recente

Total de Visitas Mensais

521149929

Taxa de Rejeição

35.96%

Média de Páginas por Visita

6.1

Duração Média da Visita

00:06:29

Show-o Tendência de Visitas

Show-o Distribuição Geográfica das Visitas

Show-o Fontes de Tráfego

Show-o Alternativas

Liquid — Um modelo de geração multimodal que integra compreensão e geração visual.

Produtividade

•Multimodal•Modelo Generativo

UniTok — UniTok é um tokenizador visual unificado para geração e compreensão visual.

Imagem

•Inteligência Artificial•Geração Visual

120

Janus-Pro-7B — Janus-Pro-7B é uma nova estrutura autoregressiva que unifica a compreensão e a geração multimodais.

Imagem

•Multimodal•Geração de Imagens

1200

Infini-Megrez — Modelo de compreensão multimodal de ponta a ponta, com sinergia de hardware e software para liberar a inteligência de ponta a ponta.

Produtividade

•Inteligência Artificial•Aprendizado Profundo

246

Show-o — Transformador único para compreensão e geração multimodal unificada

Imagem

•Inteligência Artificial•Multimodal

354

MINT-1T — Um conjunto de dados multimodais com um trilhão de tokens e 3,4 bilhões de imagens.

Código Aberto

•Multimodal•Conjunto de Dados

324

Wan2.1-FLF2V-14B — Modelo de geração de vídeo de código aberto, suporta diversas tarefas de geração.

Seleção Nacional

•Geração de vídeo•Aprendizado profundo

GLM-4-32B — Modelo de linguagem poderoso, que suporta diversas tarefas de processamento de linguagem natural.

Seleção Nacional

•Processamento de Linguagem Natural•Aprendizado Profundo

DreamActor-M1 — Uma estrutura de animação de imagem humana baseada em DiT, que realiza controle refinado e consistência de longo prazo.

Produtividade

•Animação humana•Geração de vídeo

Video-T1 — Melhora significativamente a qualidade da geração de vídeo através do dimensionamento do tempo de teste.

Produtividade

•Geração de vídeo•Dimensionamento do tempo de teste

Gemini 2.5 — O Gemini 2.5 é o modelo de IA mais inteligente do Google, com capacidade de raciocínio.

Seleção Internacional

•Inteligência Artificial•Programação

Hun Yuan T1 — Modelo de raciocínio profundo líder do setor, otimizado para preferências humanas.

Seleção Nacional

•Aprendizado profundo•Modelo de raciocínio

132

Gemini Robotics — Modelo robótico basado en Gemini 2.0, que lleva la IA al mundo físico, con capacidades visuales, lingüísticas y de movimiento.

Seleção Internacional

•Inteligencia artificial•Robótica

126

IMM — Inductive Moment Matching é um novo tipo de modelo generativo usado para gerar imagens de alta qualidade.

Imagem

•Modelo Generativo•Geração de Imagens

168

GO-1 — A Zhiyuan lançou o primeiro modelo de base de incorporação universal GO-1, propondo inovadoramente a arquitetura ViLLA, impulsionando o desenvolvimento da inteligência incorporada.

Seleção Nacional

•Inteligência Embodied•Multimodal

150

OpenAI Agents SDK — O OpenAI Agents SDK é um kit de desenvolvimento para construir agentes autônomos, simplificando a orquestração de fluxos de trabalho com múltiplos agentes.

Seleção Internacional

•Inteligência Artificial•Agentes

234

Inception Labs — O Inception Labs lança uma nova geração de modelos de linguagem grandes difusivos, oferecendo capacidade de geração de linguagem ultrarrápida, eficiente e de alta qualidade.

Seleção Internacional

•Inteligência Artificial•Modelo de Linguagem

144

HunyuanVideo-I2V — HunyuanVideo-I2V é uma estrutura de geração de imagem para vídeo lançada pela Tencent, baseada no HunyuanVideo.

Vídeo

•Geração de vídeo•Inteligência artificial

240

Migician — Migician é um modelo de linguagem grande multimodal focado na localização de imagens múltiplas, capaz de realizar localização precisa de imagens múltiplas de forma livre.

Imagem

•Multimodal•Localização de Imagens

180

Mochii AI — Mochii AI é um ecossistema de inteligência artificial personalizado, com suporte de modelos de ponta, que impulsiona o futuro da colaboração entre humanos e IA.

Seleção Nacional

•Inteligência Artificial•Ferramenta de Produtividade

150

TheoremExplainAgent — TheoremExplainAgent é um sistema inteligente usado para gerar vídeos explicativos multimodais de teoremas.

Educação

•Inteligência Artificial•Educação

QwQ-Max-Preview — QwQ-Max-Preview é o mais recente resultado da série Qwen, construído com base no Qwen2.5-Max, e apresenta poderosas capacidades de raciocínio e aplicações em múltiplas áreas.

Seleção Nacional

•Inteligência Artificial•Aprendizado Profundo

744

Claude 3.7 Sonnet — O Claude 3.7 Sonnet é o mais recente modelo de inteligência artificial da Anthropic, que oferece respostas rápidas e raciocínio profundo.

Tendência Global

•Inteligência Artificial•Aprendizado Profundo

354

ZeroBench — ZeroBench é um benchmark visual de alta dificuldade para modelos multimodais de grande porte contemporâneos.

Imagem

•Multimodal•Benchmark

300

Huginn-0125 — Huginn-0125 é um modelo de profundidade recorrente com variáveis latentes e 3,5 bilhões de parâmetros, especializado em raciocínio e geração de código.

Programação

•Inteligência Artificial•Aprendizado Profundo

222

Lumina-Video — Lumina-Video é um projeto experimental de geração de vídeo, com suporte à geração de vídeo a partir de texto.

Vídeo

•Geração de Vídeo•Inteligência Artificial

438

VideoRAG — VideoRAG é uma estrutura de geração aprimorada por recuperação para processamento de vídeos de contexto extremamente longo.

Vídeo

•Compreensão de vídeo•Recuperação aprimorada

174

VideoJAM — VideoJAM é uma estrutura para aprimorar a coerência de movimento em modelos de geração de vídeo.

Vídeo

•Geração de vídeo•Coerência de movimento

444

OmniHuman-1 — OmniHuman-1 é uma estrutura multimodal baseada em uma única imagem de rosto e sinais de movimento para gerar vídeos humanos.

Vídeo

•Inteligência Artificial•Geração de Vídeo

5736

MatAnyone — MatAnyone é um framework de remoção de fundo de vídeo estável e com foco em objetos específicos, adequado para cenários complexos.

Vídeo

•Remoção de Fundo de Vídeo•Inteligência Artificial

522

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

Show-o

Show-o Situação do Tráfego Mais Recente

Show-o Tendência de Visitas

Show-o Distribuição Geográfica das Visitas

Show-o Fontes de Tráfego

Show-o Alternativas

Liquid — Um modelo de geração multimodal que integra compreensão e geração visual.

UniTok — UniTok é um tokenizador visual unificado para geração e compreensão visual.

Janus-Pro-7B — Janus-Pro-7B é uma nova estrutura autoregressiva que unifica a compreensão e a geração multimodais.

Infini-Megrez — Modelo de compreensão multimodal de ponta a ponta, com sinergia de hardware e software para liberar a inteligência de ponta a ponta.

Show-o — Transformador único para compreensão e geração multimodal unificada

MINT-1T — Um conjunto de dados multimodais com um trilhão de tokens e 3,4 bilhões de imagens.

Wan2.1-FLF2V-14B — Modelo de geração de vídeo de código aberto, suporta diversas tarefas de geração.

GLM-4-32B — Modelo de linguagem poderoso, que suporta diversas tarefas de processamento de linguagem natural.

DreamActor-M1 — Uma estrutura de animação de imagem humana baseada em DiT, que realiza controle refinado e consistência de longo prazo.

Video-T1 — Melhora significativamente a qualidade da geração de vídeo através do dimensionamento do tempo de teste.

Gemini 2.5 — O Gemini 2.5 é o modelo de IA mais inteligente do Google, com capacidade de raciocínio.

Hun Yuan T1 — Modelo de raciocínio profundo líder do setor, otimizado para preferências humanas.

Gemini Robotics — Modelo robótico basado en Gemini 2.0, que lleva la IA al mundo físico, con capacidades visuales, lingüísticas y de movimiento.

IMM — Inductive Moment Matching é um novo tipo de modelo generativo usado para gerar imagens de alta qualidade.

GO-1 — A Zhiyuan lançou o primeiro modelo de base de incorporação universal GO-1, propondo inovadoramente a arquitetura ViLLA, impulsionando o desenvolvimento da inteligência incorporada.

OpenAI Agents SDK — O OpenAI Agents SDK é um kit de desenvolvimento para construir agentes autônomos, simplificando a orquestração de fluxos de trabalho com múltiplos agentes.

Inception Labs — O Inception Labs lança uma nova geração de modelos de linguagem grandes difusivos, oferecendo capacidade de geração de linguagem ultrarrápida, eficiente e de alta qualidade.

HunyuanVideo-I2V — HunyuanVideo-I2V é uma estrutura de geração de imagem para vídeo lançada pela Tencent, baseada no HunyuanVideo.

Migician — Migician é um modelo de linguagem grande multimodal focado na localização de imagens múltiplas, capaz de realizar localização precisa de imagens múltiplas de forma livre.

Mochii AI — Mochii AI é um ecossistema de inteligência artificial personalizado, com suporte de modelos de ponta, que impulsiona o futuro da colaboração entre humanos e IA.

TheoremExplainAgent — TheoremExplainAgent é um sistema inteligente usado para gerar vídeos explicativos multimodais de teoremas.

QwQ-Max-Preview — QwQ-Max-Preview é o mais recente resultado da série Qwen, construído com base no Qwen2.5-Max, e apresenta poderosas capacidades de raciocínio e aplicações em múltiplas áreas.

Claude 3.7 Sonnet — O Claude 3.7 Sonnet é o mais recente modelo de inteligência artificial da Anthropic, que oferece respostas rápidas e raciocínio profundo.

ZeroBench — ZeroBench é um benchmark visual de alta dificuldade para modelos multimodais de grande porte contemporâneos.

Huginn-0125 — Huginn-0125 é um modelo de profundidade recorrente com variáveis ​​latentes e 3,5 bilhões de parâmetros, especializado em raciocínio e geração de código.

Lumina-Video — Lumina-Video é um projeto experimental de geração de vídeo, com suporte à geração de vídeo a partir de texto.

VideoRAG — VideoRAG é uma estrutura de geração aprimorada por recuperação para processamento de vídeos de contexto extremamente longo.

VideoJAM — VideoJAM é uma estrutura para aprimorar a coerência de movimento em modelos de geração de vídeo.

OmniHuman-1 — OmniHuman-1 é uma estrutura multimodal baseada em uma única imagem de rosto e sinais de movimento para gerar vídeos humanos.

MatAnyone — MatAnyone é um framework de remoção de fundo de vídeo estável e com foco em objetos específicos, adequado para cenários complexos.

Huginn-0125 — Huginn-0125 é um modelo de profundidade recorrente com variáveis latentes e 3,5 bilhões de parâmetros, especializado em raciocínio e geração de código.