Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Al hardware

lista todos os produtos de hardware AI.

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas

SpeechGPT

Modelo de linguagem multimodal

Produto ComumProgramaçãoVozMultimodal

Abrir Site

O SpeechGPT é um modelo de linguagem multimodal com capacidade inerente de diálogo intermodal. Ele pode perceber e gerar conteúdo multimodal, seguindo instruções humanas multimodais. O SpeechGPT-Gen é um modelo de geração de voz que expande a cadeia de informações. O SpeechAgents é uma simulação de comunicação humana com um sistema multiagente multimodal. O SpeechTokenizer é um tokenizador de voz unificado, adequado para modelos de linguagem de voz. As datas de lançamento e informações relacionadas desses modelos e conjuntos de dados podem ser encontradas no site oficial.

Abrir Site

SpeechGPT Situação do Tráfego Mais Recente

Total de Visitas Mensais

521149929

Taxa de Rejeição

35.96%

Média de Páginas por Visita

6.1

Duração Média da Visita

00:06:29

SpeechGPT Tendência de Visitas

SpeechGPT Distribuição Geográfica das Visitas

SpeechGPT Fontes de Tráfego

SpeechGPT Alternativas

MiniCPM-o — MiniCPM-o 2.6: Um MLLM de nível GPT-4o que permite streaming visual, de voz e multimodais em dispositivos móveis.

Outros

•Multimodal•Modelo de Linguagem

438

SpeechGPT — Modelo de linguagem multimodal

Programação

•Voz•Multimodal

1446

Inception Labs — O Inception Labs lança uma nova geração de modelos de linguagem grandes difusivos, oferecendo capacidade de geração de linguagem ultrarrápida, eficiente e de alta qualidade.

Seleção Internacional

•Inteligência Artificial•Modelo de Linguagem

144

DeepSeek Japonês — DeepSeek é um modelo de linguagem IA avançado, especializado em raciocínio lógico, matemática e tarefas de programação, com uso gratuito.

Produtividade

•IA•Modelo de Linguagem

270

MiniCPM-o-2_6 — MiniCPM-o 2.6 é um poderoso modelo de linguagem grande multimodal, adequado para transmissão ao vivo visual, de voz e multimodal.

Outros

•Multimodal•Modelo de Linguagem

498

A Linguagem do Movimento — Modelo unificado de linguagem verbal e não verbal para ações corporais 3D

Outros

•Ações corporais 3D•Multimodal

210

Modelo de Linguagem Multimodal Spirit LM — Modelo de linguagem multimodal que integra texto e fala.

Produtividade

•Multimodal•Modelo de Linguagem

258

ell — Biblioteca de programação de modelos de linguagem leve, que trata prompts como funções.

Seleção Internacional

•Modelo de Linguagem•Biblioteca de Programação

270

VideoLLaMA2-7B — Modelo de linguagem de vídeo grande, oferecendo resposta a perguntas visuais e geração de legendas de vídeo.

Vídeo

•Compreensão de vídeo•Modelo de linguagem

684

ml-ferret — Modelo de linguagem de aprendizado de máquina (MLLM) de ponta a ponta, que permite referência e localização precisas.

Programação

•Aprendizado de máquina•Modelo de linguagem

1032

DreamLLM — Compreensão e Criação Multimodal Abrangente

Imagem

•Multimodal•Modelo de Linguagem

324

JinaChat — Mais modalidades, memória mais longa, custo menor

Chat

•Chat•Multimodal

240

Liquid — Um modelo de geração multimodal que integra compreensão e geração visual.

Produtividade

•Multimodal•Modelo Generativo

InternVL3 — InternVL3 de código abierto: 7 tamaños que cubren el procesamiento de texto, imágenes y video; capacidad multimodal extendida al análisis de imágenes industriales

Produtividade

•IA•Multimodal

Kimi-VL — Modelo de linguagem visual híbrido de especialista de código aberto eficiente, com capacidade de raciocínio multimodal.

Seleção Nacional

•Multimodal•Raciocínio

Llama 3.1 Nemotron Ultra 253B — Um modelo de linguagem grande eficiente para raciocínio e bate-papo.

Produtividade

•IA•Modelo de linguagem

DreamActor-M1 — Uma estrutura de animação de imagem humana baseada em DiT, que realiza controle refinado e consistência de longo prazo.

Produtividade

•Animação humana•Geração de vídeo

Gemini 2.5 — O Gemini 2.5 é o modelo de IA mais inteligente do Google, com capacidade de raciocínio.

Seleção Internacional

•Inteligência Artificial•Programação

Fin-R1 — Modelo de linguagem grande para raciocínio financeiro impulsionado por aprendizado por reforço.

Produtividade

•Finanças•Inteligência Artificial

MistralOCR.net — O Mistral OCR é um poderoso produto OCR de compreensão de documentos que consegue extrair texto, imagens, tabelas e equações de PDFs e imagens com altíssima precisão.

Produtividade

•Processamento de documentos•OCR

228

Gemini Robotics — Modelo robótico basado en Gemini 2.0, que lleva la IA al mundo físico, con capacidades visuales, lingüísticas y de movimiento.

Seleção Internacional

•Inteligencia artificial•Robótica

126

Jamba 1.6 — Modelo Jamba 1.6 lançado pela AI21, projetado para implantação privada em empresas, com excelente capacidade de processamento de texto longo.

Produtividade

•Modelo de linguagem•Processamento de texto longo

156

R1-Omni — R1-Omni ist ein multimodalen Emotionserkennungsmodell, das Reinforcement Learning integriert und sich auf die Verbesserung der Interpretierbarkeit der multimodalen Emotionserkennung konzentriert.

Programação

•Multimodal•Emotionserkennung

156

GO-1 — A Zhiyuan lançou o primeiro modelo de base de incorporação universal GO-1, propondo inovadoramente a arquitetura ViLLA, impulsionando o desenvolvimento da inteligência incorporada.

Seleção Nacional

•Inteligência Embodied•Multimodal

150

OpenAI Agents SDK — O OpenAI Agents SDK é um kit de desenvolvimento para construir agentes autônomos, simplificando a orquestração de fluxos de trabalho com múltiplos agentes.

Seleção Internacional

•Inteligência Artificial•Agentes

234

SmolVLM2 — SmolVLM2 é um modelo de linguagem leve focado na análise e geração de conteúdo de vídeo.

Vídeo

•Análise de vídeo•Geração de texto

204

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

SpeechGPT

SpeechGPT Situação do Tráfego Mais Recente

SpeechGPT Tendência de Visitas

SpeechGPT Distribuição Geográfica das Visitas

SpeechGPT Fontes de Tráfego

SpeechGPT Alternativas

MiniCPM-o — MiniCPM-o 2.6: Um MLLM de nível GPT-4o que permite streaming visual, de voz e multimodais em dispositivos móveis.

SpeechGPT — Modelo de linguagem multimodal

Inception Labs — O Inception Labs lança uma nova geração de modelos de linguagem grandes difusivos, oferecendo capacidade de geração de linguagem ultrarrápida, eficiente e de alta qualidade.

DeepSeek Japonês — DeepSeek é um modelo de linguagem IA avançado, especializado em raciocínio lógico, matemática e tarefas de programação, com uso gratuito.

MiniCPM-o-2_6 — MiniCPM-o 2.6 é um poderoso modelo de linguagem grande multimodal, adequado para transmissão ao vivo visual, de voz e multimodal.

A Linguagem do Movimento — Modelo unificado de linguagem verbal e não verbal para ações corporais 3D

Modelo de Linguagem Multimodal Spirit LM — Modelo de linguagem multimodal que integra texto e fala.

ell — Biblioteca de programação de modelos de linguagem leve, que trata prompts como funções.

VideoLLaMA2-7B — Modelo de linguagem de vídeo grande, oferecendo resposta a perguntas visuais e geração de legendas de vídeo.

Qwen-VL — Modelo de linguagem visual de uso geral

imp-v1-3b — Um poderoso modelo de linguagem multimodal de pequeno porte

Honeybee — Preditor de rede de modelo de linguagem multimodal

TinyGPT-V — Modelo de linguagem grande e multimodal eficiente

ml-ferret — Modelo de linguagem de aprendizado de máquina (MLLM) de ponta a ponta, que permite referência e localização precisas.

DreamLLM — Compreensão e Criação Multimodal Abrangente

JinaChat — Mais modalidades, memória mais longa, custo menor

Liquid — Um modelo de geração multimodal que integra compreensão e geração visual.

InternVL3 — InternVL3 de código abierto: 7 tamaños que cubren el procesamiento de texto, imágenes y video; capacidad multimodal extendida al análisis de imágenes industriales

Kimi-VL — Modelo de linguagem visual híbrido de especialista de código aberto eficiente, com capacidade de raciocínio multimodal.

Llama 3.1 Nemotron Ultra 253B — Um modelo de linguagem grande eficiente para raciocínio e bate-papo.

DreamActor-M1 — Uma estrutura de animação de imagem humana baseada em DiT, que realiza controle refinado e consistência de longo prazo.

Gemini 2.5 — O Gemini 2.5 é o modelo de IA mais inteligente do Google, com capacidade de raciocínio.

Fin-R1 — Modelo de linguagem grande para raciocínio financeiro impulsionado por aprendizado por reforço.

MistralOCR.net — O Mistral OCR é um poderoso produto OCR de compreensão de documentos que consegue extrair texto, imagens, tabelas e equações de PDFs e imagens com altíssima precisão.

Gemini Robotics — Modelo robótico basado en Gemini 2.0, que lleva la IA al mundo físico, con capacidades visuales, lingüísticas y de movimiento.

Jamba 1.6 — Modelo Jamba 1.6 lançado pela AI21, projetado para implantação privada em empresas, com excelente capacidade de processamento de texto longo.

R1-Omni — R1-Omni ist ein multimodalen Emotionserkennungsmodell, das Reinforcement Learning integriert und sich auf die Verbesserung der Interpretierbarkeit der multimodalen Emotionserkennung konzentriert.

GO-1 — A Zhiyuan lançou o primeiro modelo de base de incorporação universal GO-1, propondo inovadoramente a arquitetura ViLLA, impulsionando o desenvolvimento da inteligência incorporada.

OpenAI Agents SDK — O OpenAI Agents SDK é um kit de desenvolvimento para construir agentes autônomos, simplificando a orquestração de fluxos de trabalho com múltiplos agentes.

SmolVLM2 — SmolVLM2 é um modelo de linguagem leve focado na análise e geração de conteúdo de vídeo.