L'équipe new-yorkaise d'intelligence artificielle, Nous Research, connue pour ses modèles linguistiques « personnalisés et illimités », vient de lancer une nouvelle initiative : une API d'inférence de modèles. Cela marque un tournant pour cette institution IA quelque peu « insoumise », qui met désormais ses modèles linguistiques phares à la disposition d'un plus large public de développeurs et de chercheurs via une interface programmatique.

QQ_1741832058993.png

Un modèle « sans limites »

Nous Research a toujours attiré l'attention en remettant en question les « contraintes » imposées par les grandes entreprises d'IA comme OpenAI et Anthropic. Leur slogan respire la « liberté ». Aujourd'hui, ils décident de partager cette « liberté » sous forme d'API, pour le plus grand bénéfice de tous.

Les premières API intègrent deux produits phares : un modèle généraliste puissant, Hermes3Llama70B, basé sur l'architecture Meta Llama3.1, et un modèle d'inférence, DeepHermes-38B Preview, récemment lancé (le mois dernier), capable de basculer entre des réponses standard et des « chaînes de pensée » (Chain-of-Thought, CoT) détaillées. Une offre « tout compris » et « économique » pour les développeurs.

Cependant, accéder à ce « service express IA » n'est pas aussi simple qu'une simple commande. Nous Research a mis en place une liste d'attente. Pour compenser l'attente, chaque nouveau compte bénéficie d'un crédit gratuit de 5 $.

Cette approche vise d'une part à gérer les pics de demande potentiels, car Nous dispose probablement de moins de ressources GPU que les grandes entreprises.

D'autre part, cette « offre limitée » est une stratégie marketing astucieuse qui crée une « rareté » et suscite la curiosité.

Il est intéressant de noter que Nous Research, pourtant atypique, a opté pour une conception d'API similaire à celle d'OpenAI, avec des interfaces completions et chat completions.

Pour les développeurs familiers avec les API d'OpenAI, l'intégration des modèles Nous est transparente et facile. Nous Research allie ainsi ses convictions à une approche commerciale pragmatique : la simplicité d'utilisation est primordiale.

De « téléchargement gratuit » au « déploiement payant » : une évolution commerciale

Il y a seulement quatre mois, Nous Research lançait son premier chatbot, Nous Chat. Auparavant, l'entreprise se concentrait sur la publication de modèles open source pour un déploiement local.

Auparavant, le déploiement de ces modèles nécessitait le téléchargement du code et son exécution locale, une tâche longue, fastidieuse et potentiellement coûteuse. Désormais, via l'API, les développeurs peuvent utiliser des modèles performants sans se soucier de l'infrastructure. Nous Research passe ainsi d'un modèle purement open source à un modèle commercial plus durable.

Le lancement de cette API témoigne de la volonté de Nous Research de concilier open source et commercialisation. L'entreprise publie les poids des modèles tout en générant des revenus grâce au déploiement commercial. C'est un exercice d'équilibriste : préserver l'esprit « libre » tout en assurant la pérennité de l'entreprise.

Ce modèle hybride vise à attirer différents publics : les développeurs individuels et les chercheurs peuvent toujours télécharger et exécuter gratuitement les modèles, tandis que les entreprises privilégiant la fiabilité, la simplicité et les performances peuvent opter pour l'API payante.

Nous Research prévoit d'étendre son service d'inférence avec le temps, en intégrant d'autres modèles spécialisés, comme Hermes2Pro (spécialisé dans les appels de fonctions) et son projet Psyche. Pour les start-up d'IA innovantes basées sur des modèles open source, l'API de Nous Research offre une nouvelle alternative, bouleversant le statu quo et stimulant la compétition et l'innovation dans le domaine de l'inférence IA.

Accès : https://portal.nousresearch.com/login