Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Al hardware

liste tous les produits de matériel AI.

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

imp-v1-3b

Un puissant modèle linguistique multimodal de petite taille

Produit OrdinaireProgrammationMultimodalModèle linguistique

Ouvrir le site Web

Le projet Imp vise à fournir une série de puissants modèles linguistiques multimodaux de petite taille (MSLM). Notre imp-v1-3b est un puissant MSLM doté de 3 milliards de paramètres. Il est construit sur un petit mais puissant SLM Phi-2 (2,7 milliards) et un puissant encodeur visuel SigLIP (400 millions), et a été entraîné sur l'ensemble de données LLaVA-v1.5. Imp-v1-3b surpasse nettement ses concurrents de taille similaire dans diverses évaluations de référence multimodales, et affiche même des performances légèrement supérieures au puissant modèle LLaVA-7B dans plusieurs évaluations de référence multimodales.

Ouvrir le site Web

imp-v1-3b Dernière situation du trafic

Nombre total de visites mensuelles

27175375

Taux de rebond

44.30%

Nombre moyen de pages par visite

5.8

Durée moyenne de la visite

00:04:57

imp-v1-3b Tendance des visites

imp-v1-3b Distribution géographique des visites

imp-v1-3b Sources de trafic

imp-v1-3b Alternatives

Inception Labs — Inception Labs lance une nouvelle génération de modèles linguistiques de grande diffusion, offrant une capacité de génération de langage extrêmement rapide, efficace et de haute qualité.

Sélection Internationale

•Intelligence artificielle•Modèle linguistique

354

Modèle linguistique Spirit LM — Modèle linguistique multi-modal intégrant texte et voix

Productivité

•Multimodal•Modèle linguistique

228

imp-v1-3b — Un puissant modèle linguistique multimodal de petite taille

Programmation

•Multimodal•Modèle linguistique

294

Liquid — Un modèle de génération multimodale intégrant la compréhension et la génération d'images.

Productivité

•Multimodal•Modèle génératif

Fin-R1 — Grand modèle de raisonnement financier piloté par l'apprentissage par renforcement.

Productivité

•Finance•Intelligence artificielle

138

Mistral Small 3.1 — Modèle open source améliorant les capacités de traitement des tâches textuelles et visuelles.

Productivité

•Multimodal•Traitement du texte

300

Gemini Robotics — Modèle robotique basé sur Gemini 2.0, intégrant l'IA dans le monde physique, doté de capacités visuelles, linguistiques et motrices.

Sélection Internationale

•Intelligence artificielle•Robotique

174

GO-1 — Zhiyuan lance GO-1, son premier grand modèle de base incarné universel, présentant une architecture ViLLA révolutionnaire et stimulant le développement de l'intelligence incarnée.

Sélection Nationale

•Intelligence incarnée•Multimodal

168

OpenAI Agents SDK — OpenAI Agents SDK est une boîte à outils de développement permettant de créer des agents autonomes et de simplifier l'orchestration des workflows multi-agents.

Sélection Internationale

•Intelligence artificielle•Agent

318

Instella — Instella est un modèle linguistique open source haute performance développé par AMD, conçu pour accélérer le développement des modèles linguistiques open source.

Programmation

•Open source•Modèle linguistique

150

UniTok — UniTok est un tokeniseur visuel unifié pour la génération et la compréhension d'images.

Image

•Intelligence artificielle•Génération d'images

156

Migician — Migician est un grand modèle linguistique multimodale axé sur la localisation multi-images, capable de réaliser une localisation précise multi-images de forme libre.

Image

•Multimodal•Localisation d'images

162

Mochii AI — Mochii AI est un écosystème d'intelligence artificielle personnalisé, basé sur des modèles de pointe, qui favorise l'avenir de la collaboration entre l'homme et l'IA.

Sélection Nationale

•Intelligence artificielle•Outil de productivité

162

TheoremExplainAgent — TheoremExplainAgent est un système intelligent permettant de générer des vidéos explicatives multimodales de théorèmes.

Éducation

•Intelligence artificielle•Éducation

180

GPT-4.5 — GPT-4.5, le dernier modèle linguistique lancé par OpenAI, se concentre sur l'amélioration des capacités d'apprentissage non supervisé et offre une expérience interactive plus naturelle.

Tendance Mondiale

•Intelligence artificielle•Modèle linguistique

138

Gemini 2.0 Flash-Lite — Gemini 2.0 Flash-Lite est un modèle linguistique efficace, optimisé pour le traitement de longs textes et de nombreux scénarios d'application.

Productivité

•IA•Modèle linguistique

180

DeepSeek Japonais — DeepSeek est un modèle linguistique IA avancé, maîtrisant le raisonnement logique, les mathématiques et la programmation, et disponible gratuitement.

Productivité

•IA•Modèle linguistique

258

ZeroBench — ZeroBench est un benchmark visuel hautement exigeant conçu pour les grands modèles multimodaux contemporains.

Image

•Multimodal•Benchmark

264

Application OLMoE — Ai2 OLMoE est une application de modèle linguistique open source fonctionnant sur les appareils iOS.

Sélection Internationale

•Open source•Modèle linguistique

276

VideoRAG — VideoRAG est un framework de génération amélioré par la recherche conçu pour traiter des vidéos à contexte extrêmement long.

Vidéo

•Compréhension vidéo•Recherche augmentée

156

Xwen-Chat — Xwen-Chat est un ensemble de modèles linguistiques de grande taille spécialisé dans les dialogues en chinois, offrant plusieurs versions de modèles et des services de génération de langage.

Chat

•Modèle linguistique•Dialogue chinois

378

OmniHuman-1 — OmniHuman-1 est un cadre multi-modal permettant de générer des vidéos humaines à partir d'une seule image portrait et de signaux de mouvement.

Vidéo

•Intelligence artificielle•Génération de vidéo

5724

MILS — Les grands modèles linguistiques (LLM) peuvent voir et entendre sans aucune formation.

Image

•Intelligence artificielle•Multimodal

186

Janus-Pro-7B — Janus-Pro-7B est un nouveau framework autorégressif unifiant la compréhension et la génération multimodales.

Image

•Multimodal•Génération d'images

1266

Le Dernier Examen de l'Humanité — Le Dernier Examen de l'Humanité est un benchmark multimodale destiné à évaluer les capacités des grands modèles de langage.

Autre

•Intelligence Artificielle•Benchmark

204

UI-TARS — UI-TARS est un modèle d'agent GUI natif de nouvelle génération conçu pour automatiser les interactions avec les interfaces graphiques utilisateur.

Sélection Nationale

•Intelligence artificielle•Automatisation

3948

MiniMax-01 — Modèle linguistique puissant disposant de 456 milliards de paramètres au total, capable de traiter un contexte jusqu'à 4 millions de jetons.

Programmation

•Intelligence artificielle•Modèle linguistique

426

MinMo — MinMo est un grand modèle linguistique multimodal conçu pour une interaction vocale transparente.

Chat

•Interaction vocale•Multimodal

252

MiniCPM-o — MiniCPM-o 2.6 : un MLLM (Modèle Linguistique Multimodal) de niveau GPT-4o, capable de réaliser des diffusions en direct visuelles, vocales et multimodales sur un téléphone portable.

Autre

•Multimodal•Modèle linguistique

420

Moondream AI — Modèle linguistique visuel open source, fonctionnant sur divers appareils.

Autre

•Intelligence artificielle•Open source

252