Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Al hardware

liste tous les produits de matériel AI.

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

FireRedASR

Modèle de reconnaissance automatique de la parole (RAP) en mandarin standard industriel open source, compatible avec de multiples scénarios d'application.

Produit OrdinaireProductivitéReconnaissance vocaleIntelligence artificielle

Ouvrir le site Web

FireRedASR est un modèle de reconnaissance automatique de la parole (RAP) en mandarin standard industriel open source, adoptant une architecture intégrée Encodeur-Décodeur et LLM. Il comprend deux variantes : FireRedASR-LLM et FireRedASR-AED, conçues respectivement pour des exigences de hautes performances et d'efficacité énergétique. Ce modèle offre d'excellents résultats aux tests de référence en mandarin standard, et affiche également de bonnes performances pour la reconnaissance de la parole en dialectes et en anglais. Il convient aux applications industrielles nécessitant une transcription vocale efficace, telles que les assistants intelligents et la génération de sous-titres vidéo. Le modèle étant open source, il est facile à intégrer et à optimiser pour les développeurs.

Ouvrir le site Web

FireRedASR Dernière situation du trafic

Nombre total de visites mensuelles

968

Taux de rebond

42.98%

Nombre moyen de pages par visite

1.4

Durée moyenne de la visite

00:03:01

FireRedASR Tendance des visites

FireRedASR Distribution géographique des visites

FireRedASR Sources de trafic

FireRedASR Alternatives

FireRedASR — Modèle de reconnaissance automatique de la parole (RAP) en mandarin standard industriel open source, compatible avec de multiples scénarios d'application.

Productivité

•Reconnaissance vocale•Intelligence artificielle

252

Agno — Une bibliothèque légère pour construire des agents multimodaux.

Productivité

•Agent multi-modal•Open source

Fin-R1 — Grand modèle de raisonnement financier piloté par l'apprentissage par renforcement.

Productivité

•Finance•Intelligence artificielle

138

Reka Flash 3 — Modèle d'inférence généraliste de 21 milliards de paramètres, adapté aux applications à faible latence.

Productivité

•Intelligence artificielle•Traitement du langage naturel

114

Orpheus TTS — Un système de texte à parole open source, visant à créer une voix humaine naturelle.

Productivité

•Texte à parole•Open source

408

Mistral Small 3.1 — Modèle open source améliorant les capacités de traitement des tâches textuelles et visuelles.

Productivité

•Multimodal•Traitement du texte

300

Light-R1 — Light-R1 est un projet open source axé sur l'inférence à longues chaînes (Long COT), qui fournit une méthode d'entraînement complète, de zéro, via SFT, DPO et RL.

Programmation

•Intelligence artificielle•Infèrence à longues chaînes

186

Sesame CSM — Un modèle permettant de générer de la parole conversationnelle, capable de générer de la parole de haute qualité à partir d'entrées textuelles et audio.

Productivité

•Synthèse vocale•Intelligence artificielle

240

IMM — Inductive Moment Matching est un nouveau type de modèle génératif utilisé pour la génération d'images de haute qualité.

Image

•Modèle génératif•Génération d'images

276

Instella — Instella est un modèle linguistique open source haute performance développé par AMD, conçu pour accélérer le développement des modèles linguistiques open source.

Programmation

•Open source•Modèle linguistique

150

Migician — Migician est un grand modèle linguistique multimodale axé sur la localisation multi-images, capable de réaliser une localisation précise multi-images de forme libre.

Image

•Multimodal•Localisation d'images

162

IndexTTS — Système texte-parole zéro-shot industriel, contrôlable et efficace

Productivité

•Synthèse vocale•Intelligence artificielle

102

QwQ-Max-Preview — QwQ-Max-Preview est le dernier né de la série Qwen, basé sur Qwen2.5-Max. Il offre des capacités de raisonnement et d'applications multi-domaines puissantes.

Sélection Nationale

•Intelligence artificielle•Apprentissage profond

744

AlphaMaze-v0.2-1.5B — Méthode innovante pour améliorer les capacités de raisonnement visuel des grands modèles linguistiques (LLM) en résolvant des tâches de labyrinthes textuels.

Autre

•Intelligence artificielle•Modèles linguistiques

180

Le Manuel des Systèmes Ultra-Scalables — Un outil dédié à la conception et à l'optimisation de systèmes ultra-scalables, offrant des solutions performantes.

Sélection Internationale

•Systèmes ultra-scalables•Optimisation

324

SkyReels-V1-Hunyuan-I2V — SkyReels V1 est un modèle de base vidéo open source centré sur l'humain, axé sur la génération de vidéos de qualité cinématographique.

Vidéo

•Génération vidéo•Intelligence artificielle

492

OpenThinker-32B — OpenThinker-32B est un puissant modèle d'inférence open source, conçu pour améliorer les capacités d'inférence sur des données ouvertes.

Programmation

•Intelligence artificielle•Modèle d'inférence

246

Application OLMoE — Ai2 OLMoE est une application de modèle linguistique open source fonctionnant sur les appareils iOS.

Sélection Internationale

•Open source•Modèle linguistique

276

Huginn-0125 — Huginn-0125 est un modèle profond récurrent à variables latentes de 3,5 milliards de paramètres, excellemment adapté au raisonnement et à la génération de code.

Programmation

•Intelligence artificielle•Apprentissage profond

192

FireRedASR-AED-L — Modèle de reconnaissance automatique de la parole (RAP) industriel open source, prenant en charge le mandarin, les dialectes chinois et l'anglais, aux performances exceptionnelles.

Productivité

•Reconnaissance vocale•Open source

288

RAG-FiT — RAG-FiT est une bibliothèque conçue pour améliorer la capacité des grands modèles de langage (LLM) à exploiter des informations externes, en affinant les modèles sur un ensemble de données spécialement créé pour l'augmentation RAG.

Programmation

•Intelligence artificielle•Traitement du langage naturel

204

Nom de code Goose — Agent d'intelligence artificielle fonctionnant localement, automatisant les tâches d'ingénierie de manière transparente.

Sélection Internationale

•Intelligence artificielle•Aide à la programmation

294

Open-source DeepResearch — Outil de recherche approfondie open source visant à reproduire les fonctionnalités de Deep Research via un framework open source.

Programmation

•Open source•Intelligence artificielle

228

Tülu 3 405B — Tülu 3 405B est un modèle linguistique de grande envergure, open source, dont les performances ont été améliorées par apprentissage par renforcement.

Programmation

•Intelligence artificielle•Traitement du langage naturel

648

SpeechGPT 2.0 - version préliminaire — Premier système d'interaction en temps réel de niveau humain axé sur l'intelligence contextuelle, prenant en charge l'interaction vocale multi-émotionnelle et multi-stylistique.

Chat

•Interaction vocale•Intelligence artificielle

252

leapfusion-hunyuan-image2video — Une nouvelle technique d'échantillonnage image-vers-vidéo, basée sur le modèle Hunyuan, permettant la génération de vidéos de haute qualité.

Vidéo

•Intelligence artificielle•Génération vidéo

474

Baichuan-M1-14B — Modèle linguistique large open source développé par Baichuan Intelligence, optimisé pour les scénarios médicaux, offrant des capacités générales et des performances exceptionnelles dans le domaine médical.

Productivité

•Modèle linguistique large•Médical

408

FilmAgent — FilmAgent est un framework de collaboration multi-agents basé sur les LLM, conçu pour la production cinématographique automatisée de bout en bout dans un espace 3D virtuel.

Vidéo

•Intelligence artificielle•Production cinématographique

432

DeepSeek-R1 — DeepSeek-R1 est un modèle d'inférence haute performance, prenant en charge plusieurs langues et tâches, adapté à la recherche et aux applications commerciales.

Sélection Nationale

•Intelligence artificielle•Modèle d'inférence

8976

RealtimeSTT — Une bibliothèque robuste, efficace et à faible latence de conversion de la parole en texte, dotée d'une détection avancée d'activité vocale, d'une activation par mot de veille et d'une transcription instantanée.

Productivité

•Reconnaissance vocale•Transcription en temps réel

324