
Cerebras 會打造專用的 AI 系統,好加快 AI 模型的長篇輸出效率。能有這樣獨一無二的高速率,除了拜將可觀的運算能力、記憶體和頻寬整合在一起的巨型晶片所賜以外,消除拖累傳統硬體推斷流程的瓶頸也功不可沒。
將 Cerebras 整合到我們的運算解決方案之中,可以大幅提升我們 AI 的回應速度。在你提出複雜問題、產生程式碼、建立圖片或是運行 AI 代理程式的時候,後台會有這麼一個循環:使用者發出一則請求,然後模型會開始進行思考並回傳結果。AI 如果能即時給出回應的話,使用者就會給出更多的請求、多花時間與其互動並執行附加價值更高的工作負載。
我們會分階段將這個低延遲的能力整合到我們的推斷堆疊中,好將其擴展到各種工作負載上。
OpenAI 的團隊成員 Sachin Katti 這麼說道:「OpenAI 的運算策略乃是『建立一個具韌性的組合,好將合適的系統匹配給合適的工作負載』。Cerebras 為我們的平台新增了一個專門的低延遲推斷解決方案。而我們也因此受惠,能夠打造更快速的回應、更自然的互動以及更穩健的基礎,好為更多的使用者提供即時 AI 的功能與服務。」
Cerebras 的共同創辦人暨執行長——Andrew Feldman 表示:「我們很高興能夠與 OpenAI 攜手合作,將領先全球的 AI 模型應用在全球最快速的 AI 處理器上。正如寬頻改變了網際網路,即時推斷的功能也勢必將會翻轉 AI,並藉此發掘出建構 AI 模型以及與 AI 模型互動的全新方式。」
相應產能會在 2028 年前陸續實裝完成。


