跳至主要内容
OpenAI

2026年1月14日

全球事务

OpenAI 与 Cerebras 达成合作

OpenAI 正与 Cerebras 合作,为我们的平台新增 750 兆瓦的超低延迟 AI 算力。

蓝绿色渐变背景上,OpenAI 与 Cerebras 的标识左右并排,中间以一条竖线分隔。

Cerebras 打造专为 AI 设计的定制化系统,用于加速 AI 模型的长文本生成。其独特的速度源于将海量计算单元、内存与带宽集成于单一巨型芯片,从而消除了传统硬件上制约推理速度的瓶颈。

将 Cerebras 纳入我们的计算解决方案组合,核心目标就是让我们的 AI 响应更快。当您提出复杂问题、生成代码、创作图像或运行AI智能体时,幕后都在进行一个循环:您发送请求,模型思考,然后返回结果。当 AI 能够实时响应时,用户便能完成更多任务、停留更长时间,并运行价值更高的工作负载。

我们将分阶段把这项低延迟能力整合至我们的推理基础设施中,并逐步扩展至各类工作负载。

OpenAI 的 Sachin Katti 表示,“OpenAI 的计算策略是构建具有弹性的算力组合,为不同工作负载匹配最合适的系统。Cerebras 为我们的平台增添了一个专用的低延迟推理解决方案。这意味着更快的响应、更自然的交互,以及为向更广泛人群扩展实时AI能力奠定了更坚实的基础。”

Cerebras 联合创始人兼首席执行官 Andrew Feldman 表示,“我们非常高兴能与 OpenAI 合作,将全球领先的 AI 模型引入全球最快的 AI 处理器平台。正如宽带技术变革了互联网,实时推理也将变革 AI,催生构建 AI 模型及与之交互的全新方式。”

这部分计算能力将在 2028 年之前分批次陆续上线。