Samarbete mellan OpenAI och Cerebras
OpenAI samarbetar med Cerebras för att lägga till 750 MW AI-beräkningskapacitet med ultralåg latens till vår plattform.

Cerebras bygger specialanpassade AI-system för att påskynda tidskrävande utdata från AI-modeller. Den unika hastigheten uppnås genom att enorm datorkraft, minne och bandbredd samlas på ett enda stort chip och de flaskhalsar som bromsar inferens på traditionell hårdvara elimineras.
Integrationen av Cerebras i vår mix av beräkningslösningar syftar till att göra vår AI betydligt snabbare. När du ställer en svår fråga, genererar kod, skapar en bild eller kör en AI-agent, körs en loop i bakgrunden: du skickar en förfrågan, modellen tänker efter och skickar tillbaka något. När AI reagerar i realtid använder användarna den mer, stannar kvar längre och utför mer värdefulla arbetsuppgifter.
Vi kommer att gradvis integrera den här kapaciteten med låg latens i vår inferensstack och utvidga den till ytterligare arbetsbelastningar.
”OpenAI:s beräkningsstrategi är att bygga en motståndskraftig portfölj som matchar rätt system med rätt arbetsbelastningar. Cerebras kompletterar vår plattform med en dedikerad lösning för inferens med låg latens. Det betyder snabbare svar, mer naturliga interaktioner och en starkare grund för att skala upp AI i realtid till många fler människor,” sade Sachin Katti från OpenAI.
”Vi är mycket glada över samarbetet med OpenAI och att vi kan erbjuda världens ledande AI-modeller på världens snabbaste AI-processor. Precis som bredband har förändrat internet kommer realtidsinferens att transformera AI och öppna helt nya möjligheter att utveckla AI-modeller och interagera med dem”, säger Andrew Feldman, medgrundare och VD för Cerebras.
Kapaciteten kommer att bli tillgänglig i flera omgångar fram till 2028.


