
Cerebras 建造專門的 AI 系統,以加速 AI 模型的長輸出。其獨特的速度源於將大量運算、記憶體和頻寬整合到一個巨型晶片上,並消除在傳統硬件上拖慢推理的瓶頸。
將 Cerebras 整合到我們的運算解決方案組合中,務求加快我們的 AI 回覆。當你提出一個棘手問題、產生程式碼、創作圖像或運行 AI 代理時,背後會有一個循環在運作:你發出請求,模型進行思考,然後發回結果。當 AI 即時回覆時,用戶便能藉此完成更多工作、停留更久,並運行更高價值的工作負載。
我們將分階段將這項低延遲能力整合到我們的推理架構中,並擴展至各類工作負載。
「OpenAI 的運算策略是建立一個具韌性的組合,將合適的系統與合適的工作負載配對。Cerebras 為我們的平台新增了一個專用的低延遲推理解決方案。這意味著回覆更快、互動更自然,並為將即時 AI 擴展至更多人奠定更穩固的基礎,」OpenAI 的 Sachin Katti 說。
「我們很高興與 OpenAI 合作,將全球領先的 AI 模型引入全球最快的 AI 處理器。正如寬頻改變了互聯網,即時推理將改變 AI,帶來全新的方式來建立並與 AI 模型互動。」Cerebras 聯合創辦人兼行政總裁 Andrew Feldman 說。
該功能將於 2028 年分多個批次上線。


