Zum Hauptinhalt springen
OpenAI

Zusammenarbeit zwischen OpenAI und Cerebras

OpenAI geht eine Partnerschaft mit Cerebras ein, um unsere Plattform um 750 MW an KI-Rechenleistung mit extrem niedriger Latenz zu erweitern.

Die Logos von OpenAI und Cerebras nebeneinander, getrennt durch eine vertikale Linie, auf einem blau-grünen Farbverlauf.

Cerebras entwickelt speziell konzipierte KI-Systeme, um lange Ausgaben von KI-Modellen zu beschleunigen. Die einzigartige Geschwindigkeit entsteht dadurch, dass enorme Rechenleistung, Speicher und Bandbreite auf einem einzigen riesigen Chip zusammengeführt und die Engpässe beseitigt werden, die die Inferenz auf herkömmlicher Hardware ausbremsen. 

 Die Integration von Cerebras in unseren Mix aus Rechenlösungen zielt darauf ab, unsere KI deutlich schneller reagieren zu lassen. Wenn du eine schwierige Frage stellst, Code generierst, ein Bild erstellst oder einen KI-Agenten ausführst, läuft im Hintergrund eine Schleife ab: Du sendest eine Anfrage, das Modell denkt nach und sendet etwas zurück. Wenn KI in Echtzeit reagiert, machen Benutzer mehr damit, bleiben länger und führen höherwertige Workloads aus.

Wir werden diese latenzarme Kapazität schrittweise in unseren Inferenz-Stack integrieren und auf weitere Workloads ausweiten.  

„OpenAIs Compute-Strategie ist der Aufbau eines resilienten Portfolios, das die richtigen Systeme den richtigen Workloads zuordnet. Cerebras ergänzt unsere Plattform um eine dedizierte Lösung für latenzarme Inferenz. Das bedeutet schnellere Antworten, natürlichere Interaktionen und eine stärkere Grundlage, um Echtzeit-KI für sehr viele weitere Menschen zu skalieren“, sagte Sachin Katti von OpenAI.

„Wir freuen uns sehr über die Partnerschaft mit OpenAI und bringen die weltweit führenden KI-Modelle auf den weltweit schnellsten KI-Prozessor. So wie Breitband das Internet verändert hat, wird Echtzeit-Inferenz die KI transformieren und völlig neue Wege eröffnen, KI-Modelle zu entwickeln und mit ihnen zu interagieren“, sagte Andrew Feldman, Mitgründer und CEO von Cerebras.

Die Kapazität wird bis 2028 in mehreren Tranchen verfügbar sein.