Das New Yorker KI-Team Nous Research, bekannt für seine „personalisierten, uneingeschränkten“ Sprachmodelle, hat einen neuen Schritt gewagt: die Einführung einer brandneuen Modell-Inferenz-API. Dies markiert einen Wendepunkt für die bisher eher „unbändige“ KI-Institution, die nun ihre hochgelobten Sprachmodelle über programmierbare Schnittstellen einem breiteren Kreis von Entwicklern und Forschern zugänglich macht.

QQ_1741832058993.png

„Uneingeschränkte“ Modelle

Nous Research hat stets durch die Infragestellung der „Einschränkungen“ großer KI-Unternehmen wie OpenAI und Anthropic Aufmerksamkeit erregt. Ihr Motto klingt nach „Freiheitsdenken“. Jetzt haben sie beschlossen, diese „Freiheit“ als API zu verpacken und mehr Menschen zugänglich zu machen.

Die ersten APIs enthalten zwei Hauptprodukte: Zum einen das leistungsstarke Universalmodell Hermes3Llama70B, basierend auf der Meta Llama3.1-Architektur, zum anderen das erst letzten Monat veröffentlichte Inferenzmodell DeepHermes-38B Preview, das flexibel zwischen Standardantworten und detaillierten „Chain-of-Thought“ (CoT) wechseln kann. Dies bietet Entwicklern quasi ein „Luxus-Paket“ und eine „Budget-Variante“.

Der Zugriff auf diesen „KI-Express“ ist jedoch nicht ganz so einfach wie eine Bestellung. Nous Research verwendet ein Warteliste-System nach dem Prinzip „Wer zuerst kommt, mahlt zuerst“. Um die wartenden Nutzer zu beruhigen, gibt es für jedes neue Konto ein kostenloses Guthaben von 5 US-Dollar.

Dieser Ansatz dient einerseits der technischen Bewältigung potenziell hoher Nachfrage, da Nous im Vergleich zu großen Unternehmen mit „Geldmitteln“ möglicherweise über weniger GPU-Ressourcen verfügt.

Andererseits ist diese „limitierte Verfügbarkeit“ eine clevere Marketingstrategie, die eine „Knappheit“ erzeugt und die Neugier auf das Angebot steigert.

Interessanterweise orientiert sich das scheinbar „eigenwillige“ Nous Research beim API-Design an OpenAI, einschließlich der Schnittstellen completions und chat completions.

Für Entwickler, die mit OpenAI-Schnittstellen vertraut sind, bedeutet dies eine nahtlose Integration der Nous-Modelle in ihre Anwendungen. Dies zeigt, dass Nous neben der Beibehaltung seiner eigenen Philosophie auch pragmatische Geschäftsüberlegungen berücksichtigt. Denn letztendlich zählt die Benutzerfreundlichkeit.

Von „kostenlosem Download“ zur „kostenpflichtigen Bereitstellung“

Erst vor vier Monaten veröffentlichte Nous Research seinen ersten Chatbot mit Benutzeroberfläche, Nous Chat. Zuvor konzentrierte sich das Unternehmen auf die Veröffentlichung von Open-Source-Modellen zur lokalen Bereitstellung.

Früher mussten Nutzer diese Modelle selbst herunterladen und lokal ausführen, was zeitaufwendig, umständlich und möglicherweise teuer war. Über die API können Entwickler nun direkt leistungsstarke Modelle nutzen, ohne sich um die Infrastruktur kümmern zu müssen. Dies markiert einen wichtigen Schritt von Nous Research weg von einem reinen Open-Source-Modell hin zu einem nachhaltigeren Geschäftsmodell.

Die Einführung der API zeigt das Bestreben von Nous Research, neben der Beibehaltung der Open-Source-Prinzipien auch einen Weg zur Kommerzialisierung zu finden. Sie veröffentlichen die Modellgewichte öffentlich und generieren Einnahmen durch kommerzielle Bereitstellung. Dies ist ein Balanceakt: die „freie“ Seele soll unberührt bleiben, aber der „Körper“ soll gesund überleben.

Dieses Mischmodell zielt offensichtlich auf verschiedene Benutzergruppen ab: Einzelentwickler und Forscher können Modelle weiterhin kostenlos herunterladen und ausführen, während Unternehmen, die Wert auf Zuverlässigkeit, Benutzerfreundlichkeit und Leistungsoptimierung legen, die kostenpflichtige API nutzen können.

Nous Research wird seinen Inferenzdienst im Laufe der Zeit erweitern und möglicherweise weitere spezielle Modelle hinzufügen, wie z. B. Hermes2Pro, das auf Funktionsaufrufe spezialisiert ist, und sein Psyche-Projekt. Für KI-Startups, die auf Open-Source-Modellen basieren, bietet die API von Nous Research eine neue Option, die die bestehende Struktur aufbricht, den Wettbewerb im Bereich der KI-Inferenz verschärfen und die technologische Entwicklung vorantreiben könnte.

Zugang: https://portal.nousresearch.com/login