OpenAI werkt samen met Cerebras
OpenAI werkt samen met Cerebras om 750 MW aan AI-rekenkracht met ultarlage latentie aan ons platform toe te voegen.

Cerebras bouwt specifieke AI-systemen om lange uitvoer van AI-modellen te versnellen. De unieke snelheid ontstaat door het samenbrengen van enorme rekenkracht, geheugen en bandbreedte op één gigantische chip en door het elimineren van de knelpunten die inferentie op conventionele hardware vertragen.
We hebben Cerebras in onze verschillende rekenkrachtoplossingen geïntegreerd om onze AI veel sneller te laten reageren. Wanneer je een moeilijke vraag stelt, code genereert, een afbeelding maakt of een AI-agent laat werken, gebeuren er achter de schermen heel wat dingen: je stuurt een verzoek, het model denkt na en stuurt iets terug. Wanneer AI meteen reageert, doen gebruikers er meer mee, blijven ze langer en voeren ze belangrijkere workloads uit.
We zullen deze capaciteit met lage latentie geleidelijk integreren in onze inferentiestack en deze uitbreiden naar verschillende workloads.
“De rekenkrachtstrategie van OpenAI bouwt mee aan een veerkrachtig portfolio dat de juiste systemen aan de juiste workloads koppelt. Cerebras voegt een speciale oplossing voor inferentie met lage latentie toe aan ons platform. Dat betekent snellere reacties, natuurlijkere interacties en een sterkere basis om realtime AI op te schalen naar veel meer mensen”, aldus Sachin Katti van OpenAI.
“We zijn verheugd om samen te werken met OpenAI. Zo brengen we de toonaangevende AI-modellen van de wereld naar de snelste AI-processor ter wereld. Net zoals breedband het internet veranderde, zal realtime inferentie ook voor een transformatie van AI zorgen, waardoor er volledig nieuwe manieren ontstaan om AI-modellen te bouwen en ermee te interageren", aldus Andrew Feldman, medeoprichter en CEO van Cerebras.
De capaciteit zal in meerdere tranches online komen in de loop van 2028.


