2026年1月14日

OpenAI 与 Cerebras 达成合作

OpenAI 正与 Cerebras 合作，为我们的平台新增 750 兆瓦的超低延迟 AI 算力。

Cerebras 打造专为 AI 设计的定制化系统，用于加速 AI 模型的长文本生成。其独特的速度源于将海量计算单元、内存与带宽集成于单一巨型芯片，从而消除了传统硬件上制约推理速度的瓶颈。

将 Cerebras 纳入我们的计算解决方案组合，核心目标就是让我们的 AI 响应更快。当您提出复杂问题、生成代码、创作图像或运行AI智能体时，幕后都在进行一个循环：您发送请求，模型思考，然后返回结果。当 AI 能够实时响应时，用户便能完成更多任务、停留更长时间，并运行价值更高的工作负载。

我们将分阶段把这项低延迟能力整合至我们的推理基础设施中，并逐步扩展至各类工作负载。

OpenAI 的 Sachin Katti 表示，“OpenAI 的计算策略是构建具有弹性的算力组合，为不同工作负载匹配最合适的系统。Cerebras 为我们的平台增添了一个专用的低延迟推理解决方案。这意味着更快的响应、更自然的交互，以及为向更广泛人群扩展实时AI能力奠定了更坚实的基础。”

Cerebras 联合创始人兼首席执行官 Andrew Feldman 表示，“我们非常高兴能与 OpenAI 合作，将全球领先的 AI 模型引入全球最快的 AI 处理器平台。正如宽带技术变革了互联网，实时推理也将变革 AI，催生构建 AI 模型及与之交互的全新方式。”

这部分计算能力将在 2028 年之前分批次陆续上线。

继续阅读

全球事务2026年7月15日

全球事务2026年7月8日

全球事务2026年7月8日