L'essor des modèles d'inférence profonde ! Together AI lève 305 millions de dollars, stimulant la demande de GPU

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Feb 21, 2025

Dans le secteur de l'IA, Together AI a récemment annoncé une levée de fonds de série B de 305 millions de dollars, une nouvelle qui a suscité un vif intérêt. L'essor de la société est étroitement lié à son nouveau modèle d'inférence profonde, DeepSeek-R1. Contrairement aux craintes initiales, de nombreux experts du secteur estiment que les progrès de l'inférence profonde n'ont pas diminué, mais au contraire augmenté la demande d'infrastructures.

Puce GPU (2)

Source : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney

Créée en 2023, Together AI vise à simplifier l'utilisation des grands modèles linguistiques (LLM) open source pour les entreprises. Au fil du temps, la société a progressivement étendu sa plateforme, proposant une solution appelée « plateforme Together » qui prend en charge le déploiement de l'IA sur des clouds privés virtuels et en environnement local. En 2025, Together AI a lancé des clusters d'inférence et des capacités d'IA agentive, renforçant ainsi les fonctionnalités de sa plateforme.

Selon Vipul Prakash, PDG de Together AI, DeepSeek-R1 possède un nombre de paramètres impressionnant de 671 milliards, ce qui rend son coût d'exécution d'inférence considérable. Pour répondre à la demande croissante des utilisateurs, Together AI a lancé le service « clusters d'inférence », offrant aux clients une puissance de calcul dédiée allant de 128 à 2000 puces pour garantir des performances optimales du modèle. De plus, le temps de traitement des requêtes de DeepSeek-R1 est généralement long, atteignant en moyenne deux à trois minutes, ce qui contribue également à l'augmentation des besoins en infrastructure.

En ce qui concerne les applications du modèle d'inférence, Together AI a identifié des cas d'utilisation concrets, tels que les agents de codage, la réduction des hallucinations du modèle et l'amélioration du modèle par apprentissage par renforcement. Ces applications améliorent non seulement l'efficacité du travail, mais aussi la précision des résultats du modèle.

En outre, Together AI a acquis CodeSandbox pour renforcer ses capacités en matière de workflows d'IA agentive. Cette acquisition permet l'exécution rapide de code dans le cloud, réduisant la latence et améliorant les performances des workflows des agents.

Face à une concurrence acharnée, la plateforme d'infrastructure de Together AI est en constante optimisation. Le déploiement de la nouvelle génération de puces Nvidia Blackwell offrira des performances et une latence améliorées pour l'entraînement et l'inférence des modèles. Prakash souligne que la vitesse d'inférence de Together AI est significativement supérieure à celle d'autres plateformes comme Azure, répondant ainsi parfaitement aux besoins des clients en matière d'infrastructure IA hautes performances.

Points clés :
🌟 Together AI a levé 305 millions de dollars, stimulant le développement des modèles d'inférence profonde.
📈 La complexité de DeepSeek-R1 a entraîné une augmentation significative des besoins en infrastructure, conduisant au lancement du service « clusters d'inférence » pour répondre à la demande du marché.
🚀 La nouvelle acquisition de CodeSandbox et les puces Nvidia Blackwell renforceront davantage la compétitivité de Together AI sur le marché.

TogetherAI DeepSeek-R1 Grands modèles de langage Cloud privé virtuel

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Les modèles open source contre-attaquent : l'optimisation adaptative au moment des tests (TAO) de Databricks surpasse GPT-4o

Databricks, une société spécialisée dans l'intelligence des données, a récemment lancé une nouvelle méthode de finetuning pour les grands modèles de langage : TAO (Test-time Adaptive Optimization). Cette technologie ouvre de nouvelles perspectives pour le développement des modèles open source. En utilisant des données non annotées et l'apprentissage par renforcement, TAO excelle non seulement en termes de réduction des coûts pour les entreprises, mais obtient également des résultats remarquables sur une série de tests de référence. Selon NeoWin, TAO...

Mar 27, 2025

L'équipe CMU présente le méta-renforcement fin-tuning : un nouveau paradigme pour améliorer les capacités de raisonnement des grands modèles de langage

Dans le domaine de l'intelligence artificielle, les grands modèles de langage (LLM) sont en constante évolution. Récemment, des chercheurs de la Carnegie Mellon University (CMU) et de HuggingFace ont proposé une nouvelle méthode appelée "méta-renforcement fin-tuning" (Meta Reinforcement Fine-Tuning, MRT). Cette méthode vise à optimiser l'efficacité de calcul des grands modèles de langage lors des tests, notamment pour résoudre des problèmes de raisonnement complexes. Les recherches montrent que les grands modèles de langage actuels présentent des limites en matière de raisonnement...

Mar 13, 2025

Passerelle Portkey AI : Solution IA open source pour intégrer facilement plusieurs grands modèles de langage

Mar 6, 2025

ByteDance lance AIBrix : un nouveau système d'inférence open source conçu pour les grands modèles de langage

Feb 28, 2025

Alexa mise à niveau complète : intégration officielle des grands modèles de langage, révolutionnant le secteur des assistants IA

Feb 28, 2025

Microsoft open-source OmniParser V2 : permettre aux grands modèles de langage de « comprendre » et d'interagir avec les interfaces graphiques

Microsoft a récemment lancé une version mise à jour de son grand modèle linguistique OmniParser pour Windows : OmniParser-v2.0. Ce modèle est capable d'identifier les éléments d'interface utilisateur de bureau et de fenêtre et d'interagir avec eux, marquant une avancée significative des technologies AIAgent vers une utilisation entièrement automatisée de l'ordinateur. La capacité clé d'OmniParser-v2.0 réside dans sa capacité de perception et d'interaction avec l'environnement de bureau. Cela signifie que, grâce à son intégration, les AIAgent peuvent

Feb 17, 2025

12.9k

Rapport : Perplexity, moteur de recherche IA, cherche à fusionner avec TikTok aux États-Unis

La startup américaine de moteur de recherche Perplexity AI a récemment soumis une proposition de fusion à ByteDance, la société mère de TikTok, visant à combiner Perplexity et la version américaine de TikTok en une nouvelle entité. Selon des sources bien informées, cette proposition revêt une importance particulière face à l'interdiction imminente aux États-Unis. TikTok fait face à une interdiction du gouvernement américain, censée entrer en vigueur ce dimanche, sauf si elle parvient à se séparer de ByteDance. Cependant, pour le moment...

Jan 19, 2025

1.9k

NVIDIA et les universités publient « FlashInfer » : une nouvelle bibliothèque de noyaux pour améliorer l’efficacité de l’inférence des grands modèles de langage

Avec l’essor des grands modèles de langage (LLM) dans les applications modernes d’intelligence artificielle, des outils tels que les robots conversationnels et les générateurs de code s’appuient sur les capacités de ces modèles. Cependant, les problèmes d’efficacité liés au processus d’inférence deviennent de plus en plus importants. En particulier, le traitement des mécanismes d’attention, tels que FlashAttention et SparseAttention, se révèle souvent insuffisant face à des charges de travail diverses, des modes d’entrée dynamiques et des limitations des ressources GPU. Ces défis, associés à des latences élevées et à des goulots d’étranglement de la mémoire,

Jan 6, 2025

2.2k

L'Université Harvard publie un jeu de données de plusieurs millions de livres pour entraîner des modèles d'IA

L'Université Harvard a récemment annoncé son intention de publier un jeu de données composé de près d'un million de livres du domaine public. Ce jeu de données pourra être utilisé par quiconque pour entraîner des grands modèles de langage et d'autres outils d'intelligence artificielle. Ce projet est mené par la nouvelle initiative de données institutionnelles (Institutional Data Initiative) de l'Université Harvard, et a été réalisé grâce au financement de Microsoft et d'OpenAI. Ce jeu de données comprend des livres numérisés provenant du projet Google Books, et couvre des œuvres classiques telles que celles de Shakespeare, Dickens et Dante, etc.

Dec 13, 2024

2.1k

Les chercheurs découvrent une méthode économe en énergie pour entraîner les grands modèles de langage, réduisant la consommation d'énergie de 30%

Une nouvelle étude de l'Université du Michigan a récemment révélé qu'une méthode économe en énergie pour entraîner les grands modèles de langage permet de réaliser la même tâche dans le même laps de temps, mais avec une réduction de la consommation d'énergie de 30 %. Cette méthode permettrait d'économiser suffisamment d'énergie pour alimenter 1,1 million de foyers américains d'ici 2026. Les chercheurs ont développé un outil logiciel appelé Perseus qui identifie les chemins critiques, c'est-à-dire la séquence de sous-tâches qui prennent le plus de temps à s'exécuter. Perseus réduit ensuite la vitesse du processeur sur les chemins non critiques afin qu'ils puissent tous être terminés simultanément.

Nov 8, 2024

1.4k

Actualités IA

IA Quotidien

Chronologie de l'IA

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu