Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas

Stable Diffusion 3.5 Medium

Modelo de transformador de difusão multimodal baseado em texto para geração de imagens

Produto ComumImagemTexto para imagemModelo generativo

Abrir Site

Stable Diffusion 3.5 Medium é um modelo de geração de imagem a partir de texto, desenvolvido pela Stability AI, que apresenta qualidade de imagem, composição tipográfica, compreensão de prompts complexos e eficiência de recursos aprimoradas. O modelo utiliza três codificadores de texto pré-treinados fixos, melhorando a estabilidade do treinamento através da normalização QK, e introduzindo blocos de atenção dupla nas primeiras 12 camadas de transformação. Ele demonstra excelente desempenho na geração de imagens em múltiplas resoluções, consistência e adaptabilidade a diversas tarefas de texto para imagem.

Abrir Site

Stable Diffusion 3.5 Medium Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

Stable Diffusion 3.5 Medium Tendência de Visitas

Stable Diffusion 3.5 Medium Distribuição Geográfica das Visitas

Stable Diffusion 3.5 Medium Fontes de Tráfego

Stable Diffusion 3.5 Medium Alternativas

Stable Diffusion 3.5 Medium — Modelo de transformador de difusão multimodal baseado em texto para geração de imagens

Imagem

•Texto para imagem•Modelo generativo

462

stable-diffusion-3.5-large-turbo — Modelo de geração de imagem a partir de texto de alta performance

Imagem

•Texto para imagem•Modelo gerador

666

stable-diffusion-3.5-large — Modelo de geração de imagem a partir de texto de alto desempenho

Imagem

•IA•Geração de Imagens

456

Lumina-T2X — Uma estrutura unificada de geração de texto para qualquer modalidade.

Imagem

•Texto para imagem•Texto para vídeo

486

Destilação de Consistência de Trajetória (TCD) — Técnica de destilação de consistência para melhorar a qualidade da síntese de imagem a partir de texto.

Imagem

•Síntese de imagem•Destilação de consistência

786

DreamActor-M1 — Uma estrutura de animação de imagem humana baseada em DiT, que realiza controle refinado e consistência de longo prazo.

Produtividade

•Animação humana•Geração de vídeo

Gemini 2.5 — O Gemini 2.5 é o modelo de IA mais inteligente do Google, com capacidade de raciocínio.

Seleção Internacional

•Inteligência Artificial•Programação

MistralOCR.net — O Mistral OCR é um poderoso produto OCR de compreensão de documentos que consegue extrair texto, imagens, tabelas e equações de PDFs e imagens com altíssima precisão.

Produtividade

•Processamento de documentos•OCR

228

Gemini Robotics — Modelo robótico basado en Gemini 2.0, que lleva la IA al mundo físico, con capacidades visuales, lingüísticas y de movimiento.

Seleção Internacional

•Inteligencia artificial•Robótica

126

IMM — Inductive Moment Matching é um novo tipo de modelo generativo usado para gerar imagens de alta qualidade.

Imagem

•Modelo Generativo•Geração de Imagens

168

R1-Omni — R1-Omni ist ein multimodalen Emotionserkennungsmodell, das Reinforcement Learning integriert und sich auf die Verbesserung der Interpretierbarkeit der multimodalen Emotionserkennung konzentriert.

Programação

•Multimodal•Emotionserkennung

156

GO-1 — A Zhiyuan lançou o primeiro modelo de base de incorporação universal GO-1, propondo inovadoramente a arquitetura ViLLA, impulsionando o desenvolvimento da inteligência incorporada.

Seleção Nacional

•Inteligência Embodied•Multimodal

150

OpenAI Agents SDK — O OpenAI Agents SDK é um kit de desenvolvimento para construir agentes autônomos, simplificando a orquestração de fluxos de trabalho com múltiplos agentes.

Seleção Internacional

•Inteligência Artificial•Agentes

234

SmolVLM2 — SmolVLM2 é um modelo de linguagem leve focado na análise e geração de conteúdo de vídeo.

Vídeo

•Análise de vídeo•Geração de texto

204

Inception Labs — O Inception Labs lança uma nova geração de modelos de linguagem grandes difusivos, oferecendo capacidade de geração de linguagem ultrarrápida, eficiente e de alta qualidade.

Seleção Internacional

•Inteligência Artificial•Modelo de Linguagem

144

Aya Vision — Aya Vision é um modelo de visão multimodal multilíngue lançado pela Cohere, com o objetivo de melhorar a capacidade de compreensão visual e textual em cenários multilíngues.

Seleção Internacional

•Multilíngue•Multimodal

126

CogView4-6B — CogView4-6B é um poderoso modelo de geração de imagem a partir de texto, focado na geração de imagens de alta qualidade.

Imagem

•Texto para imagem•Aprendizado profundo

132

CogView4 — CogView4 é um modelo de geração de imagem a partir de texto de alta resolução que suporta chinês e inglês.

Imagem

•Texto para imagem•Alta resolução

234

EgoLife — EgoLife é um projeto de assistente de IA para a vida cotidiana, de longo prazo, multimodal e multiperspectivo, com o objetivo de impulsionar a pesquisa em compreensão de contexto de longo prazo.

Produtividade

•IA•Multimodal

120

UniTok — UniTok é um tokenizador visual unificado para geração e compreensão visual.

Imagem

•Inteligência Artificial•Geração Visual

120

ViDoRAG — ViDoRAG é uma estrutura de agente de raciocínio iterativo dinâmico que combina recuperação de documentos visuais com geração aprimorada.

Programação

•Multimodal•Geração Aprimorada por Recuperação

138

Migician — Migician é um modelo de linguagem grande multimodal focado na localização de imagens múltiplas, capaz de realizar localização precisa de imagens múltiplas de forma livre.

Imagem

•Multimodal•Localização de Imagens

180

Mochii AI — Mochii AI é um ecossistema de inteligência artificial personalizado, com suporte de modelos de ponta, que impulsiona o futuro da colaboração entre humanos e IA.

Seleção Nacional

•Inteligência Artificial•Ferramenta de Produtividade

150

M2RAG — Repositório de código de benchmark para geração aprimorada por recuperação em contexto multimodal.

Programação

•Multimodal•Geração aprimorada por recuperação

TheoremExplainAgent — TheoremExplainAgent é um sistema inteligente usado para gerar vídeos explicativos multimodais de teoremas.

Educação

•Inteligência Artificial•Educação

Gemini 2.0 Flash-Lite — Gemini 2.0 Flash-Lite est un modèle linguistique efficace, optimisé pour le traitement de longs textes et de nombreux scénarios d'application.

Produtividade

•IA•Modèle linguistique

120

Phi-4-multimodal-instruct — Phi-4-multimodal-instruct é um modelo básico multimodal leve desenvolvido pela Microsoft, que suporta entrada de texto, imagem e áudio.

Produtividade

•Multimodal•Reconhecimento de Voz

210

Magma-8B — Magma-8B é um modelo de IA multimodal lançado pela Microsoft, capaz de processar entradas de imagem e texto e gerar saídas de texto.

Imagem

•Multimodal•IA

156

DeepSeek Japonês — DeepSeek é um modelo de linguagem IA avançado, especializado em raciocínio lógico, matemática e tarefas de programação, com uso gratuito.

Produtividade

•IA•Modelo de Linguagem

270

Microsoft Muse — Muse é o primeiro modelo de IA generativa da Microsoft para concepção de jogos, capaz de gerar efeitos visuais e ações de controle de jogos.

Outros

•IA•Desenvolvimento de jogos

210