Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

SpeechGPT

Modèle linguistique multimodal

Produit OrdinaireProgrammationVoixMultimodal

Ouvrir le site Web

SpeechGPT est un modèle linguistique multimodal doté d'une capacité intrinsèque de dialogue multi-modal. Il peut percevoir et générer du contenu multimodal et suivre les instructions humaines multimodales. SpeechGPT-Gen est un modèle de génération vocale étendu avec une chaîne d'informations. SpeechAgents est une simulation de communication humaine avec un système multi-agents multimodal. SpeechTokenizer est un tokeniseur vocal unifié adapté aux modèles linguistiques vocaux. Les dates de publication et les informations relatives à ces modèles et ensembles de données sont disponibles sur le site officiel.

Ouvrir le site Web

SpeechGPT Dernière situation du trafic

Nombre total de visites mensuelles

474564576

Taux de rebond

36.20%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:34

SpeechGPT Tendance des visites

SpeechGPT Distribution géographique des visites

SpeechGPT Sources de trafic

SpeechGPT Alternatives

MiniCPM-o — MiniCPM-o 2.6 : un MLLM (Modèle Linguistique Multimodal) de niveau GPT-4o, capable de réaliser des diffusions en direct visuelles, vocales et multimodales sur un téléphone portable.

Autre

•Multimodal•Modèle linguistique

420

SpeechGPT — Modèle linguistique multimodal

Programmation

•Voix•Multimodal

1488

Inception Labs — Inception Labs lance une nouvelle génération de modèles linguistiques de grande diffusion, offrant une capacité de génération de langage extrêmement rapide, efficace et de haute qualité.

Sélection Internationale

•Intelligence artificielle•Modèle linguistique

354

Gemini 2.0 Flash-Lite — Gemini 2.0 Flash-Lite est un modèle linguistique efficace, optimisé pour le traitement de longs textes et de nombreux scénarios d'application.

Productivité

•IA•Modèle linguistique

180

DeepSeek Japonais — DeepSeek est un modèle linguistique IA avancé, maîtrisant le raisonnement logique, les mathématiques et la programmation, et disponible gratuitement.

Productivité

•IA•Modèle linguistique

258

Le Langage du Mouvement — Modèle unifié de langage verbal et non verbal pour les mouvements corporels 3D

Autre

•Mouvements corporels 3D•Multimodal

162

Modèle linguistique Spirit LM — Modèle linguistique multi-modal intégrant texte et voix

Productivité

•Multimodal•Modèle linguistique

228

ell — Bibliothèque de programmation de modèle linguistique léger, traitant les invites comme des fonctions.

Sélection Internationale

•Modèle linguistique•Bibliothèque de programmation

318

Enchanted — Application iOS/macOS pour dialoguer avec des modèles linguistiques privés et auto-hébergés.

Programmation

•swift•ios

1044

VideoLLaMA2-7B — Grand modèle linguistique vidéo, offrant des fonctionnalités de question-réponse visuelle et de génération de sous-titres vidéo.

Vidéo

•Compréhension vidéo•Modèle linguistique

672

Qwen-VL — Modèle linguistique visuel polyvalent

Productivité

•Vision•Modèle linguistique

2604

imp-v1-3b — Un puissant modèle linguistique multimodal de petite taille

Programmation

•Multimodal•Modèle linguistique

294

Honeybee — Prédicteur d'amélioration locale pour les modèles linguistiques multimodaux

Productivité

•Multimodal•Modèle linguistique

402

TinyGPT-V — Modèle linguistique large multimodal performant

Productivité

•Modèle linguistique•Multimodal

540

ml-ferret — Modèle linguistique de machine (MLLM) de bout en bout, permettant une citation et une localisation précises.

Programmation

•Machine Learning•Modèle linguistique

1086

DreamActor-M1 — Un framework d'animation d'images humaines basé sur DiT, permettant un contrôle précis et une cohérence à long terme.

Productivité

•Animation humaine•Génération vidéo

Gemini 2.5 — O Gemini 2.5 é o modelo de IA mais inteligente do Google, com capacidade de raciocínio.

Sélection Internationale

•Inteligência Artificial•Programação

Fin-R1 — Grand modèle de raisonnement financier piloté par l'apprentissage par renforcement.

Productivité

•Finance•Intelligence artificielle

138

Mistral Small 3.1 — Modèle open source améliorant les capacités de traitement des tâches textuelles et visuelles.

Productivité

•Multimodal•Traitement du texte

300

MistralOCR.net — Mistral OCR est un puissant produit OCR de compréhension de documents, capable d'extraire avec une très grande précision le texte, les images, les tableaux et les équations à partir de PDF et d'images.

Productivité

•Traitement de documents•OCR

186

Gemini Robotics — Modèle robotique basé sur Gemini 2.0, intégrant l'IA dans le monde physique, doté de capacités visuelles, linguistiques et motrices.

Sélection Internationale

•Intelligence artificielle•Robotique

174

Jamba 1.6 — Le modèle Jamba 1.6, lancé par AI21, est spécialement conçu pour le déploiement privé en entreprise et offre des capacités exceptionnelles de traitement de longs textes.

Productivité

•Modèle linguistique•Traitement de longs textes

108

R1-Omni — R1-Omni est un modèle de reconnaissance d'émotions multimodales combinant l'apprentissage par renforcement, axé sur l'amélioration de l'interprétabilité de la reconnaissance d'émotions multimodales.

Programmation

•Multimodal•Reconnaissance d'émotions

378

GO-1 — Zhiyuan lance GO-1, son premier grand modèle de base incarné universel, présentant une architecture ViLLA révolutionnaire et stimulant le développement de l'intelligence incarnée.

Sélection Nationale

•Intelligence incarnée•Multimodal

168

OpenAI Agents SDK — OpenAI Agents SDK est une boîte à outils de développement permettant de créer des agents autonomes et de simplifier l'orchestration des workflows multi-agents.

Sélection Internationale

•Intelligence artificielle•Agent

318

SmolVLM2 — SmolVLM2 ist ein leichtgewichtiges Sprachmodell, das sich auf die Analyse und Generierung von Videoinhalten konzentriert.

Vidéo

•Videoanalyse•Textgenerierung

150

OpenManus — OpenManus est un projet d'agent intelligent open source utilisable sans code d'invitation.

Productivité

•Open source•Agent intelligent

1356

Actualités IA

IA Quotidien

Chronologie de l'IA

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu

SpeechGPT

SpeechGPT Dernière situation du trafic

SpeechGPT Tendance des visites

SpeechGPT Distribution géographique des visites

SpeechGPT Sources de trafic

SpeechGPT Alternatives

MiniCPM-o — MiniCPM-o 2.6 : un MLLM (Modèle Linguistique Multimodal) de niveau GPT-4o, capable de réaliser des diffusions en direct visuelles, vocales et multimodales sur un téléphone portable.

SpeechGPT — Modèle linguistique multimodal

Inception Labs — Inception Labs lance une nouvelle génération de modèles linguistiques de grande diffusion, offrant une capacité de génération de langage extrêmement rapide, efficace et de haute qualité.

Gemini 2.0 Flash-Lite — Gemini 2.0 Flash-Lite est un modèle linguistique efficace, optimisé pour le traitement de longs textes et de nombreux scénarios d'application.

DeepSeek Japonais — DeepSeek est un modèle linguistique IA avancé, maîtrisant le raisonnement logique, les mathématiques et la programmation, et disponible gratuitement.

Le Langage du Mouvement — Modèle unifié de langage verbal et non verbal pour les mouvements corporels 3D

Modèle linguistique Spirit LM — Modèle linguistique multi-modal intégrant texte et voix

ell — Bibliothèque de programmation de modèle linguistique léger, traitant les invites comme des fonctions.

Enchanted — Application iOS/macOS pour dialoguer avec des modèles linguistiques privés et auto-hébergés.

VideoLLaMA2-7B — Grand modèle linguistique vidéo, offrant des fonctionnalités de question-réponse visuelle et de génération de sous-titres vidéo.

Qwen-VL — Modèle linguistique visuel polyvalent

imp-v1-3b — Un puissant modèle linguistique multimodal de petite taille

Honeybee — Prédicteur d'amélioration locale pour les modèles linguistiques multimodaux

TinyGPT-V — Modèle linguistique large multimodal performant

ml-ferret — Modèle linguistique de machine (MLLM) de bout en bout, permettant une citation et une localisation précises.

CLoT — Découvrez le potentiel créatif et humoristique des LLM

DreamLLM — Compréhension et création multimodales intégrées

JinaChat — Multimodalités, mémoire étendue, coût réduit

DreamActor-M1 — Un framework d'animation d'images humaines basé sur DiT, permettant un contrôle précis et une cohérence à long terme.

Gemini 2.5 — O Gemini 2.5 é o modelo de IA mais inteligente do Google, com capacidade de raciocínio.

Fin-R1 — Grand modèle de raisonnement financier piloté par l'apprentissage par renforcement.

Mistral Small 3.1 — Modèle open source améliorant les capacités de traitement des tâches textuelles et visuelles.

MistralOCR.net — Mistral OCR est un puissant produit OCR de compréhension de documents, capable d'extraire avec une très grande précision le texte, les images, les tableaux et les équations à partir de PDF et d'images.

Gemini Robotics — Modèle robotique basé sur Gemini 2.0, intégrant l'IA dans le monde physique, doté de capacités visuelles, linguistiques et motrices.

Jamba 1.6 — Le modèle Jamba 1.6, lancé par AI21, est spécialement conçu pour le déploiement privé en entreprise et offre des capacités exceptionnelles de traitement de longs textes.

R1-Omni — R1-Omni est un modèle de reconnaissance d'émotions multimodales combinant l'apprentissage par renforcement, axé sur l'amélioration de l'interprétabilité de la reconnaissance d'émotions multimodales.

GO-1 — Zhiyuan lance GO-1, son premier grand modèle de base incarné universel, présentant une architecture ViLLA révolutionnaire et stimulant le développement de l'intelligence incarnée.

OpenAI Agents SDK — OpenAI Agents SDK est une boîte à outils de développement permettant de créer des agents autonomes et de simplifier l'orchestration des workflows multi-agents.

SmolVLM2 — SmolVLM2 ist ein leichtgewichtiges Sprachmodell, das sich auf die Analyse und Generierung von Videoinhalten konzentriert.

OpenManus — OpenManus est un projet d'agent intelligent open source utilisable sans code d'invitation.