Cerebras Systems hat kürzlich die Errichtung von sechs neuen Rechenzentren in Nordamerika und Europa angekündigt, um seine Fähigkeiten im Bereich der KI-Inferenz zu verbessern. Dieser Schritt wird die Rechenleistung des Unternehmens deutlich steigern und die Entwicklung verschiedener KI-Anwendungen unterstützen.

Nach Plan werden 85 % der Rechenleistung in den USA konzentriert. Drei Einrichtungen in Santa Clara und Stockton (Kalifornien) sowie in Dallas (Texas) sind bereits in Betrieb. Weitere neue Zentren werden in Minneapolis (voraussichtlich im zweiten Quartal 2025), Oklahoma City und Montreal (voraussichtlich im dritten Quartal 2025) sowie in Atlanta und Frankreich (voraussichtlich im vierten Quartal 2025) eröffnet.

Supercomputer Rechenzentrum (3)

Bildquelle: Das Bild wurde mit KI generiert und von Midjourney bereitgestellt.

Das Herzstück der neuen Rechenzentren ist der von Cerebras entwickelte „Wafer Scale Engine“ (WSE), eine spezielle Chip-Architektur, die für KI-Anwendungen optimiert ist. Das Unternehmen gibt an, dass sein CS-3-System 40 Millionen Token pro Sekunde für das Llama-70B-Modell verarbeiten kann, was die Geschwindigkeit bei Inferenzaufgaben erheblich verbessert. In der Einrichtung in Oklahoma City sollen über 300 CS-3-Systeme installiert werden. Das Zentrum wird nach dem Tier III+ Standard gebaut, ist widerstandsfähig gegen Tornados und Erdbeben und verfügt über eine dreifach redundante Stromversorgung. Der Betrieb soll im Juni 2025 beginnen.

Mehrere bekannte KI-Unternehmen haben bereits Kooperationsvereinbarungen mit Cerebras abgeschlossen, darunter das französische Startup Mistral mit seinem Le Chat Assistenten und die KI-Antwortmaschine Perplexity. Hugging Face und AlphaSense nutzen ebenfalls die Cerebras-Plattform. Diese Technologie eignet sich besonders gut für Inferenzmodelle, die lange Berechnungen benötigen und eine große Anzahl von Token generieren, wie z. B. Deepseek-R1 und OpenAI o3.

Die Erweiterung ist Teil der Gesamtstrategie von Cerebras für das Jahr 2025. Einige Einrichtungen werden in Zusammenarbeit mit dem emiratischen Unternehmen G42 betrieben. In Montreal wird das neue Zentrum, das von der Bit Digital-Tochter Enovum verwaltet wird, voraussichtlich im Juli 2025 in Betrieb gehen und eine zehnmal schnellere Inferenzgeschwindigkeit als aktuelle GPUs bieten.

Cerebras Systems ist ein US-amerikanisches Unternehmen, das sich auf die Entwicklung von KI-Chips konzentriert. Seine einzigartige Designphilosophie besteht darin, die gesamte Wafer als einzelnen Chip zu verwenden. Derzeit wird die dritte Generation des Wafer Scale Engine, WSE-3, angeboten. Das System wird bereits in Einrichtungen wie dem Argonne National Laboratory, dem Pittsburgh Supercomputing Center und GlaxoSmithKline eingesetzt. Trotz der Vorteile der Technologie gibt es auch Einschränkungen, wie z. B. die fehlende native CUDA-Unterstützung (Nvidia-Standard) und eine geringere Serverkompatibilität im Vergleich zu Nvidia-Lösungen.

Wichtigste Punkte:

🌍 Cerebras plant den Bau von sechs neuen Rechenzentren in Nordamerika und Europa, wobei der Schwerpunkt auf den USA liegt. Der vollständige Betrieb ist für 2025 geplant.

⚡ Die Rechenzentren werden mit einzigartigen Wafer-Scale-Chips ausgestattet, die eine Verarbeitungsleistung von 40 Millionen Token pro Sekunde ermöglichen.

🤝 Mehrere bekannte KI-Unternehmen haben bereits mit Cerebras zusammengearbeitet, um die Vorteile der Hochgeschwindigkeits-Inferenz zu nutzen.