Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Al hardware

liste tous les produits de matériel AI.

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

Together AI publie l'ensemble de données RedPajama v2 pour l'entraînement de modèles linguistiques de grande taille

站长之家

Publié leActualités IA · 2 minutes de lecture · Nov 6, 2023

Ensemble AI publie l'ensemble de données RedPajama v2

Together AI a publié l'ensemble de données RedPajama v2, contenant 30 billions de jetons, destiné à l'entraînement de grands modèles de langage. Cet ensemble de données vise à soutenir le développement réussi de grands modèles de langage en fournissant des ressources de données de haute qualité.

L'ensemble de données provient de CommonCrawl et d'autres données web publiques, et comprend plus de 40 clusters de données annotées et dédoublonnées de haute qualité. RedPajama v2 a subi un traitement minimal, préservant les données brutes pour permettre aux développeurs de modèles de les traiter ultérieurement.

Cette initiative fournira davantage de ressources pour le développement et la recherche de modèles linguistiques, et devrait stimuler le progrès du domaine de l'IA.

Ensemble de données IA Modèles linguistiques de grande taille Together AI

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Baidu lance les modèles linguistiques de grande taille Wenxin 4.5 Turbo et X1 Turbo : baisse des prix et amélioration des performances

Lors de la conférence des développeurs Create de Baidu, qui s'est tenue le 25 avril, le fondateur de Baidu, Robin Li, a présenté en grande pompe la nouvelle série de modèles linguistiques de grande taille Wenxin : Wenxin 4.5 Turbo et X1 Turbo. Ces deux nouveaux modèles ont bénéficié d'une optimisation significative en termes de vitesse et de coût, marquant une avancée majeure de Baidu dans le domaine de l'intelligence artificielle. Wenxin 4.5 Turbo, selon les informations disponibles, affiche une vitesse considérablement améliorée par rapport aux versions précédentes, avec une efficacité de traitement accrue et une baisse de prix de 80 %. Plus précisément, pour chaque million de jetons...

Apr 25, 2025

AMD lance le projet open source GAIA pour exécuter efficacement les modèles linguistiques de grande taille (LLM) en local

AMD a récemment annoncé le lancement d'une application open source nommée GAIA, conçue pour fournir aux utilisateurs un moyen efficace et local d'exécuter des modèles linguistiques de grande taille (LLM). Actuellement compatible avec Windows, l'application est optimisée pour les processeurs Ryzen AI 300, exploitant ainsi pleinement leurs avantages pour les tâches d'IA. GAIA est une application d'IA générative permettant aux utilisateurs d'exécuter des LLM en privé sur leur ordinateur personnel, garantissant ainsi la confidentialité des données. De plus, GAIA utilise…

Mar 24, 2025

Gagner 1 million de dollars en 20 mois ! Comment TypingMind, un outil de chat basé sur des modèles linguistiques de grande taille, y est-il parvenu ?

TypingMind est un outil tiers visant à offrir aux utilisateurs une expérience ChatGPT améliorée. Créé par le développeur indépendant Tony Dinh, il prend en charge plusieurs grands modèles, notamment GPT d'OpenAI et Claude d'Anthropic. Il offre des fonctionnalités de base telles que les conversations, les listes de conversations multiples et les modèles de prompts, sans nécessiter de téléchargement ni d'installation, ce qui le rend facile à utiliser. Cet outil prend également en charge le déploiement privé, offrant ainsi une protection de la confidentialité des données, et son modèle commercial...

Jan 3, 2025

6.4k

Anthropic lance Claude 3.5 Sonnet/Haiku : Contrôle de l'ordinateur via des modèles linguistiques de grande taille

Dans la nuit, Anthropic AI a lancé la série Claude 3.5, comprenant la version améliorée Claude 3.5 Sonnet et le nouveau modèle Claude 3.5 Haiku. Ces nouvelles versions présentent des améliorations significatives en termes de fonctionnalités et de performances. Une nouvelle fonctionnalité révolutionnaire a également été introduite : l'utilisation de l'ordinateur. Cette fonctionnalité permet aux développeurs, via l'API, d'utiliser Claude comme un humain pour contrôler un ordinateur, en manipulant la souris et le clavier, par exemple.

Oct 23, 2024

2.8k

Robin3D : une percée majeure dans les modèles linguistiques de grande taille pour les scènes 3D grâce à un entraînement sur des données robustes à l'échelle du million !

Une équipe de recherche de l'Illinois Institute of Technology, de l'Université de Zhejiang, de l'Université de Floride centrale et de l'Université de l'Illinois à Chicago a récemment publié Robin3D, un nouveau modèle linguistique de grande taille pour les scènes 3D. Entraîné sur un ensemble de données à grande échelle contenant un million de données d'instructions, ce modèle a atteint les meilleures performances actuelles sur cinq benchmarks d'apprentissage multi-modal 3D couramment utilisés. Ceci représente un progrès significatif dans la construction d'agents 3D universels. Le succès de Robin3D est dû à son moteur de données innovant RIG (Robu...

Oct 15, 2024

2.1k

Salesforce AI lance SFR-Judge, une nouvelle famille de modèles linguistiques de grande taille pour l'évaluation, basée sur Llama 3

Dans le domaine du traitement du langage naturel, les grands modèles linguistiques (LLM) connaissent un développement rapide et ont déjà fait des progrès significatifs dans plusieurs domaines. Cependant, avec l'augmentation de la complexité des modèles, il devient crucial d'évaluer précisément leurs résultats. Traditionnellement, nous nous appuyons sur l'évaluation humaine, mais cette méthode est à la fois chronophage et difficile à mettre à l'échelle, incapable de suivre le rythme rapide du développement des modèles. Pour changer cela, l'équipe de recherche Salesforce AI a lancé SFR-Judge, un ensemble de trois grands modèles linguistiques d'évaluation.

Sep 29, 2024

1.0k

Oracle lance HeatWave GenAI, offrant des modèles linguistiques de grande taille intégrés à la base de données

Oracle, géant de la technologie, a récemment annoncé le lancement de son service cloud HeatWave GenAI. Ce produit innovant vise à fournir aux entreprises des solutions complètes d'IA générative et d'apprentissage automatique. Il intègre de nombreuses fonctionnalités de pointe, notamment des modèles linguistiques de grande taille intégrés à la base de données, permettant l'automatisation des analyses à l'échelle des transactions et des entrepôts de données lacustres (Lakehouse).

Jul 3, 2024

1.5k

Lancement de la version préliminaire Windows d'Ollama, l'outil d'exécution LLM local

Ollama lance sa version préliminaire Windows, un outil open source pour les modèles linguistiques de grande taille axé sur les environnements d'exécution locaux. L'outil prend en charge l'exécution de plusieurs modèles, offrant une interface similaire à celle d'OpenAI et une fonctionnalité de chargement à chaud des fichiers de modèles. Le lancement de la version Windows permet à un plus grand nombre d'utilisateurs d'accéder à cet outil, permettant aux utilisateurs de créer des modèles personnalisés. Microsoft confirme que la nouvelle version de Windows sera nommée Windows 11 24H2, Win10 et Win11 restant les versions principales. Les données du deuxième trimestre publiées par Microsoft montrent X

Feb 20, 2024

2.5k

Méthode d'IA innovante BiTA : accélération de la génération de modèles linguistiques de grande taille

BiTA utilise des techniques d'optimisation bidirectionnelle et de décodage arborescente pour accélérer la génération de modèles linguistiques à architecture Transformer. Son architecture générale et sa conception modulaire le rendent adapté aux applications en temps réel telles que les robots conversationnels. Grâce à l'optimisation bidirectionnelle et à la validation d'ébauches SAR, BiTA permet une accélération des modèles linguistiques autorégressifs sans perte de qualité. Des études montrent que BiTA a permis d'obtenir des accélérations impressionnantes de 2,1× à 3,3× sur un large éventail de tâches de génération. La conception des invites ajustables fait de BiTA une méthode plug-and-play, compatible avec n'importe quel transformateur.

Feb 2, 2024

730

Plus de 40 modèles linguistiques de grande taille IA enregistrés et approuvés en Chine ces six derniers mois

Quatorze nouveaux grands modèles linguistiques ont récemment été approuvés pour une utilisation publique en Chine, notamment ceux de Xiaomi et de la quatrième paradigme. Pékin exige que les entreprises technologiques obtiennent l'approbation des autorités de régulation avant de pouvoir rendre leurs grands modèles linguistiques accessibles au public. Plus de 40 modèles linguistiques de grande taille IA au total ont reçu une autorisation d'enregistrement et d'approbation, impliquant 13 entreprises.

Jan 29, 2024

590