Arcee AI hat heute SuperNova vorgestellt, ein 70-Milliarden-Parameter-Sprachmodell für Unternehmen, das sich durch einfache Bereitstellung, fortschrittliche Anweisungsbefolgung und umfassende Anpassungsmöglichkeiten auszeichnet. Das Modell soll eine leistungsstarke und kontrollierbare Alternative zu API-basierten Diensten wie OpenAI und Anthropic bieten und dabei die entscheidenden Probleme in Bezug auf Datenschutz, Modellstabilität und Individualisierung angehen.

image.png

In einem von Cloud-APIs dominierten KI-Bereich verfolgt Arcee AI mit SuperNova einen anderen Ansatz. Dieses große Sprachmodell (LLM) kann innerhalb der eigenen Infrastruktur des Unternehmens bereitgestellt und angepasst werden. SuperNova, heute veröffentlicht, basiert auf der Meta Llama-3.1-70B-Instruct-Architektur und nutzt einen neuartigen Nachtrainingsprozess, von dem Arcee behauptet, dass er eine überragende Anweisungsbefolgung und Anpassung an spezifische Geschäftsanforderungen ermöglicht.

Technische Innovationen

Die Entwicklung von SuperNova umfasste verschiedene Nachtrainingsmethoden.

Projektleiter Lucas Atkins verriet das Geheimnis: „Wir haben drei Modelle trainiert: eines, das die Essenz von Llama405B destilliert, eines, das mit unserem EvolKit generierten Datensatz gefüttert wurde, und eines, das eine tiefgreifende DPO-Modifikation auf Llama3instruct durchlief. Schließlich haben wir sie mit einer Art neuer Magie kombiniert und die Superkräfte jedes einzelnen Modells bewahrt.“

Arcee behauptet, dass dies die Fähigkeit von SuperNova zur Anweisungsbefolgung hervorbringt, insbesondere die Destillation aus dem 405B-Parameter-Modell. Dies zeigt, dass SuperNova die Essenz größerer Modelle erfassen kann, während gleichzeitig eine Bereitstellung auf mittelschwerer Hardware möglich ist.

Unternehmensbereitstellung und -anpassung

SuperNova ist für die Bereitstellung in der eigenen Cloud-Umgebung des Unternehmens konzipiert und zunächst im AWS Marketplace verfügbar. Arcee arbeitet auch daran, es auf den Google und Azure Marketplaces verfügbar zu machen.

Mitbegründer von Arcee AI, Mark McQuade, betonte die Vorteile dieses Bereitstellungsmodells: „Das Modell wird in Ihrem AWS VPC bereitgestellt, startet aber auch einen Webserver, eine Chat-Oberfläche und eine Datenbank zur Speicherung Ihres Chat-Verlaufs. Jeder in der Organisation kann direkt mit ihm interagieren.“

Diese Bereitstellungsmethode behebt die Bedenken von Unternehmen hinsichtlich Datenschutz und Modellstabilität. Im Gegensatz zu API-basierten Diensten, die sich ohne Ankündigung ändern können, bietet SuperNova die volle Kontrolle. McQuade betonte, dass dies angesichts der jüngsten Turbulenzen in der KI-Branche besonders wichtig ist: „OpenAI hat gerade 3.5 aufgegeben… viele Unternehmen haben ihre Geschäfte um die API von 3.5 herum aufgebaut. Wenn sich also diese API ändert, stürzt Ihre Anwendung ab. In unserer Welt ändert sich jedoch nichts, es sei denn, Sie möchten es ändern, denn es ist Ihr Modell, Ihre Art, es zu betreiben.“

Anpassung und kontinuierliche Verbesserung

Ein Hauptverkaufsargument von SuperNova ist seine Fähigkeit, in der Unternehmensumgebung feinabgestimmt und umgeschult zu werden.

Atkins erklärte diesen Prozess und seine Vorteile: „Im Laufe der Zeit können wir das Modell vollständig in Ihrer eigenen Umgebung umschulen, um es besser an Ihre Vorlieben anzupassen. Wenn wir diese Chats speichern, haben wir die Möglichkeit, das Modell an die einzigartigen Vorlieben Ihres Unternehmens anzupassen, ohne dass Daten Ihr System verlassen müssen.“

Diese Fähigkeit ermöglicht es technischen Teams, das Modell an domänenspezifisches Wissen oder unternehmensspezifische Anforderungen anzupassen. Dies ist im Vergleich zu Cloud-basierten API-Diensten, die in der Regel keine derartige Anpassung zulassen, ein großer Vorteil.

Open-Source-Komponenten

Obwohl das vollständige 70B-Modell nicht Open Source ist, veröffentlicht Arcee mehrere Komponenten für die Entwickler-Community:

Kostenlose API zum Testen und Bewerten: Dies ermöglicht es Entwicklern, SuperNova zu testen, ohne sich zu einer vollständigen Bereitstellung verpflichten zu müssen.

SuperNova-Lite: Ein Open-Source-Modell mit 8B Parametern. Dieses kleinere Modell kann für Entwickler nützlich sein, die in ressourcenbeschränkten Umgebungen arbeiten oder die die Architektur kennenlernen möchten, bevor sie das vollständige Modell bereitstellen.

EvolKit: Ihre Pipeline zur Datengenerierung, um komplexe QA-Paare zu erstellen. Dieses Tool kann für Organisationen wertvoll sein, die benutzerdefinierte Trainingsdaten für ihre spezifischen Anwendungsfälle erstellen möchten.

Durch die Open-Sourcing dieser Komponenten leistet Arcee einen Beitrag zur breiteren KI-Community und bietet gleichzeitig potenziellen Kunden Tools zur Bewertung und Anpassung seines Produkts. Arcee SuperNova ist auch im AWS Marketplace verfügbar.

Leistungsangaben und Benchmarks

Arcee behauptet, dass SuperNova in verschiedenen Bereichen gut abschneidet, insbesondere in der mathematischen Schlussfolgerung. „Atkins merkte an: „Dieses Modell schneidet bei mathematischen Benchmark-Tests hervorragend ab.“ Das Unternehmen empfiehlt jedoch, dass Drittanbieterbewertungen durchgeführt werden, um seine Aussagen zu verifizieren.

„Wir werden eine API bereitstellen, die die Leute nutzen können. Wenn ein Drittanbieter glaubwürdige Benchmarks durchführen und selbst eine Bewertung vornehmen möchte, können wir ihm Zugriff auf die Gewichte gewähren. Wir möchten vollständige Transparenz in Bezug auf dieses Modell“, sagte Atkins.

Diese Offenheit für Drittanbieterbewertungen ist lobenswert, da sie eine unabhängige Überprüfung der Behauptungen von Arcee ermöglicht. Es wird besonders interessant sein zu sehen, wie sich SuperNova in Standard-Benchmarks im Vergleich zu Modellen führender KI-Unternehmen wie OpenAI und Anthropic schlägt.

image.png

image.png

Auswirkungen auf die KI-Strategie von Unternehmen

Die Veröffentlichung von SuperNova erfolgt zu einem Zeitpunkt, an dem viele Unternehmen ihre KI-Strategie neu bewerten. Während Cloud-basierte API-Dienste dieses Feld bisher dominiert haben, wächst das Interesse an bereitstellbaren und anpassbaren Modellen, die mehr Kontrolle und Flexibilität bieten.

Der Ansatz von SuperNova löst mehrere wichtige Probleme:

  • Datenschutz: Durch die Bereitstellung innerhalb der eigenen Infrastruktur des Unternehmens stellt SuperNova sicher, dass sensible Daten niemals die Kontrolle des Unternehmens verlassen.
  • Modellstabilität: Im Gegensatz zu API-Diensten, die sich ohne Ankündigung ändern oder eingestellt werden können, bietet SuperNova eine stabile Grundlage, die sich nur ändert, wenn die Organisation ein Update durchführt.
  • Anpassung: Die Möglichkeit, das Modell an unternehmensspezifische Daten anzupassen und umzuschulen, ermöglicht eine tiefgreifende Anpassung, die bei den meisten API-Diensten nicht möglich ist.
  • Kostenkontrolle: Obwohl die anfängliche Bereitstellung erhebliche Ressourcen erfordern kann, können die langfristigen Kosten für den Betrieb von SuperNova niedriger sein als die Kosten für die massenhafte Zahlung von API-Aufrufen.
  • Wettbewerbsvorteil: Ein angepasstes und kontinuierlich verbessertes KI-Modell kann in Branchen, in denen KI-gestützte Erkenntnisse entscheidend sind, einen erheblichen Wettbewerbsvorteil bieten.

Das Dilemma der KI-Souveränität

Während Unternehmen in dem sich schnell entwickelnden Bereich der KI navigieren, verdeutlicht die Veröffentlichung von SuperNova die wachsenden Spannungen in der Branche: den Kompromiss zwischen der Benutzerfreundlichkeit und den Fähigkeiten von Cloud-basierten KI-Diensten und der Kontrolle und Anpassung, die bereitstellbare Modelle bieten. Diese Dichotomie wirft auf, was wir als „Dilemma der KI-Souveränität“ bezeichnen könnten.

Auf der einen Seite bieten Cloud-basierte API-Dienste wie GPT-4 und Claude modernste Leistung und kontinuierliche Updates, jedoch auf Kosten von Datenschutzproblemen und eingeschränkter Anpassung. Auf der anderen Seite versprechen Modelle wie SuperNova vollständige Kontrolle und Anpassung, erfordern jedoch internes Fachwissen für die Bereitstellung und Wartung.

Der Ansatz von Arcee mit SuperNova versucht, diese Lücke zu schließen und ein Modell bereitzustellen, das lokal bereitgestellt werden kann und gleichzeitig Funktionen bietet, die mit denen führender Cloud-basierter Dienste vergleichbar sind. Dieser hybride Ansatz könnte besonders für Branchen mit strengen regulatorischen Anforderungen oder für Branchen attraktiv sein, die mit hochsensiblen Daten arbeiten.

Offizieller Blog: https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/