Inflection AI hat kürzlich eine bemerkenswerte Entscheidung auf seiner neuesten Unternehmensplattform getroffen: Der Wechsel von Nvidia GPUs zu Intel Gaudi3 Beschleunigern. Diese Veränderung markiert eine strategische Neuausrichtung des Unternehmens im KI-Bereich, da seine „Pi“-Kundenanwendungen zuvor auf Nvidia GPUs basierten. Inflection3.0 setzt nun auf Gaudi3, wobei Benutzer die Option haben, die Plattform lokal oder in der Tiber AI Cloud zu betreiben.
Bildquelle: Das Bild wurde mit KI generiert und stammt von Midjourney.
Inflection AI wurde 2022 gegründet und konzentrierte sich zunächst auf die Entwicklung von Pi, einem dialogorientierten persönlichen Assistenten. Nach dem Ausscheiden der Gründer Mustafa Suleyman und Karén Simonyan im Frühjahr und ihrem Wechsel zu Microsoft verlagerte sich der Fokus des Unternehmens jedoch auf den Aufbau maßgeschneiderter, feinabgestimmter Modelle für Unternehmen, wobei Kundendaten zur Verbesserung der Servicequalität genutzt werden.
Inflection3.0 ist die neueste Version der Plattform und zielt darauf ab, durch die Verwendung proprietärer Datensätze feinabgestimmte Modelle zu erstellen, um maßgeschneiderte KI-Anwendungen für Unternehmen zu entwickeln. Bemerkenswert ist, dass Intel zu den ersten Kunden gehören wird, die diesen Service nutzen, was zu Spekulationen darüber führt, ob Inflection den vollen Preis für diese Beschleuniger zahlen wird.
Obwohl Inflection plant, seine Dienste auf Gaudi3-Beschleunigern zu betreiben, wird die Einrichtung des Systems offenbar nicht schnell erfolgen. Ähnlich wie bei der vorherigen Version Inflection2.5 wird auch die neueste Version auf Intels Tiber AI Cloud-Dienst laufen. Inflection ist sich jedoch bewusst, dass einige Kunden ihre Daten möglicherweise lokal speichern möchten, und plant daher, ab dem ersten Quartal 2025 physische Systeme auf Basis von Intel KI-Beschleunigern anzubieten.
Ein Vorteil der Verwendung von Gaudi3-Beschleunigern ist die deutlich verbesserte Preis-Leistungs-Ratio. Sean White, CEO von Inflection AI, erklärte in einem Blogbeitrag, dass sie durch den Einsatz der Intel-Technologie eine bis zu zweifach höhere Preis-Leistungs-Ratio im Vergleich zu den aktuellen Konkurrenzprodukten erzielt haben. Gaudi3 wird auch als schneller und kostengünstiger als Nvidias H100 sowohl beim Training als auch bei der Inferenz angesehen.
Die technischen Spezifikationen von Gaudi3 sind ebenfalls beeindruckend: 128 GB HBM2e-Speicher, eine Bandbreite von bis zu 3,7 Tbps und eine dichte FP8- oder BF16-Leistung von 1.835 TeraFLOPS. Bei 16-Bit-Genauigkeit ist die Gleitkommaleistung von Gaudi3 fast doppelt so hoch wie die von H100, was für die von Inflection fokussierten Trainings- und Feinabstimmungs-Workloads entscheidend ist.
Darüber hinaus gab Intel kürzlich bekannt, dass IBM Gaudi3-Beschleuniger in seiner Cloud-Plattform einsetzen und dies Anfang 2025 einführen wird. Dies bedeutet, dass Gaudi3-Beschleuniger zunehmend Marktakzeptanz gewinnen.
Wichtigste Punkte:
🌟 Inflection AI entscheidet sich gegen Nvidia GPUs und für Intel Gaudi3-Beschleuniger.
🚀 Inflection3.0 basiert auf Gaudi3 und bietet Unternehmen maßgeschneiderte KI-Anwendungen.
💰 Durch die Verwendung von Gaudi3 erzielt Inflection AI eine bis zu zweifach höhere Preis-Leistungs-Ratio.