Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

Vary-toy : un modèle linguistique de grande taille et compact pour le vocabulaire visuel avancé, permettant une identification facile des objets cibles

站长之家

Publié leActualités IA · 1 minutes de lecture · Jan 31, 2024

MEGVII Technology lance Vary-toy

MEGVII Technology a publié Vary-toy, un grand modèle linguistique de vocabulaire visuel avancé adapté aux GPU standard. Optimisé pour la création de vocabulaire visuel, il vise à améliorer les capacités de perception d'image. Vary-toy a obtenu des résultats remarquables dans plusieurs tests de référence, notamment DocVQA, ChartQA et RefCOCO. Sa petite taille en fait un outil pratique pour les chercheurs disposant de ressources limitées. Les chercheurs prévoient de publier le code en open source afin de stimuler la recherche et l'adoption.

Vary-toy Petit modèle Actualités IA

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

IBM lance Granite 3.2, un petit modèle d'IA axé sur l'inférence efficace et la praticabilité

Mar 6, 2025

Collaboration petit modèle + grand modèle ! Lancement de la fonction « Recherche superficielle » par le moteur de recherche IA de Mithril

Le 18 février, Mithril Network Technology Co., Ltd. de Shanghai a annoncé le lancement de son dernier mode de recherche : la « Recherche superficielle ». Cette fonction vise à collecter rapidement des informations et à effectuer une analyse préliminaire grâce à la technologie IA, afin d'aider les utilisateurs à obtenir des résultats de recherche précieux en peu de temps.

Feb 18, 2025

2.5k

Microsoft et les universités de Pékin et Tsinghua lancent la technologie rStar-Math : un petit modèle révolutionne les problèmes mathématiques, surpassant OpenAI !

Microsoft a récemment annoncé sa nouvelle technologie rStar-Math, une méthode de raisonnement innovante applicable aux petits modèles linguistiques (SML), améliorant considérablement leurs performances en matière de résolution de problèmes mathématiques, dépassant même le modèle o1-preview d'OpenAI dans certains cas. Cette technologie est encore au stade de la recherche. L'article de recherche a été publié sur arXiv.org et est le fruit d'une collaboration entre huit auteurs de Microsoft, de l'université de Pékin et de l'université Tsinghua. Lors des tests, la technologie rStar-Math …

Jan 10, 2025

2.8k

Microsoft publie en open source Phi-4, un petit modèle puissant surpassant GPT-4o et Llama-3.1

Microsoft a récemment publié sur la plateforme Hugging Face un petit modèle linguistique appelé Phi-4. Ce modèle, ne comportant que 14 milliards de paramètres, a démontré des performances exceptionnelles lors de nombreux tests, surpassant de nombreux modèles renommés, notamment GPT-4o d'OpenAI et d'autres modèles open source similaires tels que Qwen2.5 et Llama-3.1. Lors d'un test précédent sur l'American Mathematics Competition (AMC), Phi-4 a obtenu un score de 91,8, nettement supérieur à celui de Gemini Pro1.

Jan 9, 2025

4.6k

Un petit modèle d'IA de Nvidia contrôle un robot humanoïde, 1,5 M de paramètres surpassant les systèmes professionnels

L'équipe de recherche de Nvidia a récemment réalisé une percée majeure dans le domaine du contrôle robotique. Son système de réseau neuronal, HOVER, contrôle efficacement les robots humanoïdes avec un nombre de paramètres extrêmement réduit, surpassant même les systèmes de contrôle spécialement conçus. Ce système HOVER, ne nécessitant que 1,5 million de paramètres, est capable de gérer des contrôles de mouvements robotiques complexes. En comparaison, les grands modèles de langage courants nécessitent souvent des centaines de milliards de paramètres. Cette incroyable efficacité des paramètres témoigne de la finesse de la conception du système. L'entraînement de HOVER a été effectué sur la simulation Isaac de Nvidia.

Oct 31, 2024

1.8k

Version compacte de Llama3 ! Nvidia lance le petit modèle linguistique Llama-3.1-Minitron4B, avec seulement 400 millions de paramètres

L'équipe de recherche Nvidia a utilisé des techniques d'élagage et de distillation de modèles pour lancer avec succès Llama-3.1-Minitron4B, une version compacte du modèle Llama3, conçue pour l'intelligence artificielle embarquée. Ce modèle, grâce aux techniques d'élagage en profondeur et en largeur, réduit le nombre de paramètres du modèle 8B d'origine, tout en conservant des performances similaires à celles d'un modèle plus grand. Avec une réduction significative des données d'entraînement (40 fois moins), le modèle a amélioré ses performances de 16 % sur le benchmark MMLU. Ce résultat a été obtenu grâce à la technologie NVIDIA Ne...

Aug 21, 2024

4.5k

Zyphra lance Zamba2-2.7B, un petit modèle linguistique : vitesse doublée, coût mémoire réduit de 27 %

Zyphra a lancé Zamba2-2.7B, un modèle linguistique marquant dans le domaine des petits modèles linguistiques. Ses performances et son efficacité sont considérablement améliorées. Entraîné sur un ensemble de données d'environ 3 000 milliards de jetons, il réduit les besoins en ressources lors de l'inférence, devenant une solution efficace pour les applications sur appareils mobiles. Les points forts clés incluent une première génération de réponse deux fois plus rapide, une réduction de 27 % de l'utilisation de la mémoire et une réduction de 1,29 fois du délai de génération. Il est particulièrement adapté aux applications nécessitant une interaction en temps réel, telles que les assistants virtuels et les robots de conversation. Zamba2-2.

Jul 31, 2024

2.8k

Optimisation simplifiée ! Microsoft lance le réglage fin sans serveur pour le petit modèle linguistique Phi-3

Microsoft a annoncé le lancement d'une fonctionnalité de réglage fin sans serveur pour son petit modèle linguistique Phi-3, permettant aux développeurs d'ajuster facilement les performances du modèle sur la plate-forme Azure AI, sans avoir à gérer l'infrastructure sous-jacente, et initialement gratuitement. Le modèle Phi-3, doté de 3 milliards de paramètres, convient aux développeurs d'entreprise, offrant des performances efficaces à faible coût. Comparé à GPT-3.5 d'OpenAI, bien qu'il possède moins de paramètres, il offre des performances similaires dans diverses applications. Le réglage fin sans serveur simplifie les opérations, réduit les obstacles et prend en charge le réglage fin des modèles petits et moyens. Cela

Jul 26, 2024

1.6k

NVIDIA lance Minitron, un petit modèle linguistique 40 fois plus rapide à entraîner

NVIDIA a récemment lancé Minitron, une série de petits modèles linguistiques de 4 et 8 milliards de paramètres, offrant une vitesse d'entraînement 40 fois supérieure et réduisant considérablement les besoins en ressources et en données, ce qui permet de réaliser des économies de coûts. En combinant les techniques de « élagage » et de « distillation de la connaissance », les modèles Minitron réduisent leur taille tout en maintenant leurs performances, permettant aux développeurs d'utiliser des technologies de pointe à moindre coût pour des applications telles que la traduction, l'analyse des sentiments et les IA conversationnelles. Le caractère open source de Minitron permet à un plus grand nombre de personnes d'y accéder et de l'utiliser facilement.

Jul 25, 2024

2.1k

AI Quotidien : Microsoft lance Microsoft Designer, un outil de création révolutionnaire ; Apple publie le petit modèle DCLM-Baseline-7B en open source ; Xiao Ai annonce de nouvelles fonctionnalités telles que la Q&R sur les documents IA

Bienvenue à la rubrique 【AI Quotidien】 ! Votre guide quotidien pour explorer le monde de l’intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l’IA, en mettant l’accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits IA. Découvrez les nouveaux produits IA : https://top.aibase.com/1. Microsoft lance Microsoft Designer, une application de création intégrant l’intelligence artificielle, qui simplifie la conception.

Jul 22, 2024

1.0k