Arcee AI lance aujourd'hui SuperNova, un modèle linguistique de 70 milliards de paramètres conçu pour les entreprises, offrant un déploiement sur site, des capacités avancées de suivi d'instructions et des options de personnalisation complètes. Ce modèle vise à fournir une alternative puissante et maîtrisable aux solutions basées sur des API (telles qu'OpenAI et Anthropic), en répondant aux problèmes clés liés à la confidentialité des données, à la stabilité du modèle et à la personnalisation.

image.png

Dans le domaine de l'IA dominé par les API cloud, Arcee AI adopte une approche différente avec SuperNova. Ce grand modèle linguistique (LLM) peut être déployé et personnalisé au sein de l'infrastructure propre à l'entreprise. Lancé aujourd'hui, SuperNova est basé sur l'architecture Llama-3.1-70B-Instruct de Meta et intègre un processus d'entraînement postérieur innovant, selon Arcee, qui lui confère des capacités supérieures de suivi d'instructions et d'adaptation aux besoins spécifiques des entreprises.

Innovations techniques

Le développement de SuperNova a impliqué plusieurs méthodes d'entraînement postérieur.

Lucas Atkins, ingénieur principal du projet, a révélé le secret : « Nous avons entraîné trois modèles : un distillé de l'essence de Llama405B, un autre nourri avec le jeu de données généré par notre EvolKit, et un dernier profondément transformé par DPO sur Llama3instruct. Enfin, nous les avons fusionnés grâce à une nouvelle magie, conservant les super-pouvoirs de chaque modèle. »

Arcee affirme que cela a permis d'obtenir les capacités de suivi d'instructions de SuperNova, notamment grâce à la distillation du modèle à 405 milliards de paramètres. Cela démontre la capacité de SuperNova à capturer l'essence des modèles plus importants tout en conservant un déploiement matériel modéré.

Déploiement et personnalisation en entreprise

SuperNova est conçu pour être déployé dans l'environnement cloud de l'entreprise, initialement disponible sur AWS Marketplace. Arcee travaille également à sa disponibilité sur les marchés Google et Azure.

Mark McQuade, co-fondateur d'Arcee AI, souligne les avantages de ce mode de déploiement : « Le modèle est déployé dans votre VPC AWS, mais il lance également un serveur web, une interface de chat et une base de données pour stocker l'historique de vos conversations. Chaque personne au sein de l'organisation peut interagir étroitement avec lui. »

Ce mode de déploiement répond aux préoccupations des entreprises en matière de confidentialité des données et de stabilité du modèle. Contrairement aux services basés sur des API qui peuvent changer sans préavis, SuperNova offre un contrôle total à l'entreprise. McQuade souligne l'importance de ce point compte tenu des récents bouleversements du secteur de l'IA : « OpenAI vient d'abandonner 3.5… de nombreuses entreprises ont bâti leur activité autour de l'API 3.5. Donc, dès que l'API change, votre application plante. Mais dans notre monde, rien ne change à moins que vous ne le souhaitiez, car c'est votre modèle, et c'est vous qui le contrôlez. »

Personnalisation et amélioration continue

Un des principaux arguments de vente de SuperNova est sa capacité à être affiné et réentraîné dans l'environnement de l'entreprise.

Atkins explique ce processus et ses avantages : « Au fil du temps, nous pouvons entièrement réentraîner le modèle dans votre propre environnement pour qu'il corresponde mieux à vos préférences. Comme nous conservons ces conversations, si vous souhaitez que le modèle s'améliore globalement en fonction des préférences uniques de votre entreprise, nous en avons la capacité, sans que les données ne quittent votre système. »

Cette capacité permet aux équipes techniques d'adapter le modèle à des connaissances de domaines spécifiques ou à des exigences propres à l'entreprise. C'est un avantage considérable par rapport aux services d'API cloud qui n'autorisent généralement pas ce niveau de personnalisation.

Composants open source

Bien que le modèle complet de 70 milliards de paramètres ne soit pas open source, Arcee publie plusieurs composants pour la communauté des développeurs :

Une API gratuite pour les tests et les évaluations : cela permet aux développeurs d'essayer SuperNova sans s'engager dans un déploiement complet.

SuperNova-Lite : un modèle open source de 8 milliards de paramètres. Ce modèle plus petit peut être utile aux développeurs travaillant dans des environnements aux ressources limitées ou à ceux qui souhaitent comprendre l'architecture avant de déployer le modèle complet.

EvolKit : leur pipeline de génération de jeux de données, utilisé pour créer des paires de questions-réponses complexes. Cet outil peut être précieux pour les organisations souhaitant créer des données d'entraînement personnalisées pour leurs cas d'utilisation spécifiques.

En open-sourçant ces composants, Arcee contribue à la communauté IA plus large tout en fournissant aux clients potentiels des outils pour évaluer et personnaliser son produit. Arcee SuperNova est également disponible sur AWS Marketplace.

Déclarations de performance et tests de référence

Arcee affirme que SuperNova offre de bonnes performances dans divers domaines, notamment en raisonnement mathématique. « Atkins souligne : « Il excelle dans les tests de référence mathématiques. » Cependant, l'entreprise encourage les évaluations tierces pour valider ses affirmations.

« Nous fournirons une API pour que les gens puissent l'utiliser. Si des tiers souhaitent effectuer des tests de référence fiables pour évaluer eux-mêmes, nous pouvons organiser un accès aux poids. Nous souhaitons une transparence totale sur ce modèle. » déclare Atkins.

Cette ouverture aux évaluations tierces est louable, car elle permet une validation indépendante des affirmations d'Arcee. Il sera particulièrement intéressant de voir comment les performances de SuperNova dans les tests de référence standard se comparent à celles des modèles des entreprises leaders de l'IA telles qu'OpenAI et Anthropic.

image.png

image.png

Impact sur la stratégie IA des entreprises

Le lancement de SuperNova intervient à un moment où de nombreuses entreprises réévaluent leur stratégie en matière d'IA. Bien que les services d'API cloud aient dominé le secteur, l'intérêt pour les modèles déployables et personnalisables, offrant davantage de contrôle et de flexibilité, est croissant.

L'approche de SuperNova répond à plusieurs problèmes clés :

  • Confidentialité des données : en étant déployé au sein de l'infrastructure de l'entreprise, SuperNova garantit que les données sensibles ne quittent jamais le contrôle de l'organisation.
  • Stabilité du modèle : contrairement aux services d'API qui peuvent changer ou être abandonnés sans préavis, SuperNova offre une base stable qui ne change que lorsque l'organisation choisit de la mettre à jour.
  • Personnalisation : la capacité d'affiner et de réentraîner le modèle sur des données spécifiques à l'entreprise permet une personnalisation approfondie impossible avec la plupart des services d'API.
  • Maîtrise des coûts : bien que le déploiement initial puisse nécessiter des ressources importantes, les coûts à long terme d'exploitation de SuperNova peuvent être inférieurs à ceux du paiement à grande échelle des appels d'API.
  • Avantage concurrentiel : un modèle d'IA personnalisé et en amélioration continue peut offrir un avantage concurrentiel significatif dans les secteurs où les informations basées sur l'IA sont essentielles.

Le dilemme de la souveraineté de l'IA

Alors que les entreprises naviguent dans le domaine de l'IA en évolution rapide, le lancement de SuperNova met en lumière une tension croissante au sein du secteur : le compromis entre la commodité et les capacités des services d'IA basés sur le cloud et le contrôle et la personnalisation offerts par les modèles déployables. Cette dichotomie soulève ce que nous pourrions appeler le « dilemme de la souveraineté de l'IA ».

D'un côté, les services d'API basés sur le cloud tels que GPT-4 et Claude offrent des performances de pointe et des mises à jour continues, mais au prix de problèmes de confidentialité des données et d'une personnalisation limitée. D'un autre côté, des modèles comme SuperNova promettent un contrôle et une personnalisation complets, mais nécessitent une expertise interne pour le déploiement et la maintenance.

L'approche d'Arcee avec SuperNova tente de combler ce fossé en offrant un modèle déployable sur site tout en fournissant des capacités conçues pour rivaliser avec les principaux services basés sur le cloud. Cette approche hybride pourrait être particulièrement attrayante pour les secteurs soumis à des réglementations strictes ou ceux qui traitent des données hautement sensibles.

Blog officiel : https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/