2026年2月12日

GPT‑5.3‑Codex‑Spark 登場

專為 Codex 即時程式碼編寫而打造的超高速模型。

載入中…

今天，我們推出 GPT‑5.3‑Codex‑Spark 的研究預覽版。這是 GPT‑5.3‑Codex 的小型版本，也是我們首款專為即時程式碼編寫設計的模型。Codex-Spark 針對近乎即時的體驗進行最佳化，在維持真實世界程式開發能力的同時，生成速度最高可提升 15 倍。

今年 1 月，我們宣布與 Cerebras 合作，而 Codex-Spark 就是這項計畫的第一個里程碑。我們將 Codex-Spark 以研究預覽形式提供給 ChatGPT Pro 使用者，讓開發者能及早開始試用。同時，我們正與 Cerebras 合作，提升資料中心容量、強化端到端體驗，並部署更大型的前沿模型。

我們最新的前沿模型在執行長時間任務方面表現尤其亮眼，能在無需介入的情況下，自主運行數小時、數天甚至數星期。Codex-Spark 是我們首款專為即時使用 Codex 而設計的模型，可進行精準修改、重塑邏輯或最佳化介面，當下就能看到結果。隨著 Codex-Spark 推出，Codex 系列不但能應付長時間的複雜大型專案，也能快速完成眼前的小任務。我們會從開發者的實際使用情況中汲取經驗，納入各方回饋意見，並逐步擴大使用範圍。

目前推出的 Codex-Spark 提供 128k 上下文視窗，並僅支援文字輸入。在研究預覽期間，Codex-Spark 設有獨立的速率限制，且使用量不會計入標準速率限制。不過在需求高峰時，為確保整體服務穩定性，系統可能會出現速度變慢或暫時排隊的情況。

速度和智慧

Codex-Spark 已針對互動式工作進行最佳化，在這類情境中，不只模型的智慧很重要，反應速度也同樣關鍵。你可以把模型當成即時協作的夥伴，在它執行任務時隨時中斷或重新調整方向，快速來回修改，不必等到整個部署流程跑完。由於 Codex-Spark 主要為速度而調校，預設工作方式較為精簡：只會進行必要且精準的修改，除非你主動要求，否則不會自動執行測試。

寫程式

Codex-Spark 是一款能力完整、體量較小的模型，特別針對快速推論進行最佳化。在 SWE-Bench Pro 與 Terminal-Bench 2.0 這兩項評估代理式軟體工程能力的基準測試中，GPT‑5.3‑Codex‑Spark 整體表現略低於 GPT‑5.3‑Codex，但完成任務所需的時間大幅縮短。

持續時間估算為以下各項總和：(1) 輸出生成時間（輸出 Token ÷ 取樣速度）、(2) 預填時間（預填 Token ÷ 預填速度）、(3) 工具執行總時間，以及 (4) 整體網路開銷。

所有模型的延遲改善

在訓練 Codex-Spark 的過程中，我們發現，要實現真正流暢的即時協作，光是提升模型速度還不夠，還必須降低整個請求與回應流程的延遲。因此，我們在系統層面進行端到端的延遲改善，讓所有模型都能受益。在底層架構上，我們精簡了從用戶端到伺服器再返回的串流流程，重寫推論堆疊的關鍵元件，並調整工作階段初始化方式，讓首個可見 Token 更快顯示，同時在你反覆修改時保持回應順暢。透過導入持久 WebSocket 連線，以及針對 Responses API 的最佳化，我們將每次客戶端與伺服器往返的額外開銷降低 80%、每個 Token 的開銷降低 30%，並把首個 Token 顯示的等待時間縮短 50%。無論使用哪個模型，你都能感受到整體 Codex 體驗更即時、更順暢。

由 Cerebras 驅動

Codex-Spark 運行於 Cerebras 的 Wafer Scale Engine 3⁠(在新視窗中開啟)。這是一款專為高速推論設計的 AI 加速器，為 Codex 提供以低延遲為優先的服務層級。我們與 Cerebras 合作，將這條低延遲路徑整合進與其他模型共用的生產服務架構，使其能在 Codex 中無縫運作，也為未來模型的部署做好準備。

「GPT-5.3-Codex-Spark 最讓我們感到振奮的是，能夠與 OpenAI 及開發者社群攜手探索快速推論所開啟的可能性：全新的互動模式、全新的應用情境，以及截然不同的模型體驗。這個預覽版本只是起點。」

— Sean Lie，Cerebras 共同創辦人暨技術長

GPU 仍然是我們訓練與推論流程的核心基礎，能在大規模使用情境下提供具成本效益的 Token。Cerebras 則補足這個基礎，在需要極低延遲的工作流程中表現出色，進一步縮短端到端回應時間，讓你在反覆調整時感覺更靈敏。

提供情況與詳細資訊

Codex-Spark 今日以研究預覽形式推出，提供給所有 ChatGPT Pro 使用者，可在最新版本的 Codex 應用程式、CLI 與 VS Code 擴充功能中使用。該模型在專用的低延遲硬體上運行，因此設有獨立的速率限制，並可能在研究預覽期間依需求調整。此外，我們也透過 API 向少數設計合作夥伴開放 Codex-Spark，了解開發者希望如何將其整合進產品之中。接下來幾週，我們會在真實使用情境下持續精進整合體驗，並逐步擴大開放範圍。

Codex-Spark 目前僅支援文字模式，具備 128k 上下文視窗，是超高速模型系列中的首個成員。隨著我們與開發者社群進一步探索快速模型在程式開發上的優勢，未來將推出更多能力，包括更大型的模型、更長的上下文，以及多模態輸入。

Codex-Spark 採用與主線模型相同的安全訓練，包括與網路安全相關的訓練內容。我們依照標準部署流程進行評估，包含網路安全與其他能力的基準測試，並確認該模型不具備達到應變整備框架中網路安全「高能力」門檻的合理可能性。

未來規畫

Codex-Spark 是邁向雙模式 Codex 的第一步：一方面支援長時間推理與執行，另一方面提供即時協作，讓你能快速反覆調整。未來這兩種模式會逐漸融合，Codex 可以在維持緊密互動的同時，把長時間任務交給背景子智慧體處理，或在需要同時兼顧廣度與速度時，將任務並行分派給多個模型，讓你不必一開始就選定單一模式。

隨著模型能力持續提升，互動速度逐漸成為明顯的瓶頸。超高速推論能縮短這個來回過程，讓 Codex 使用起來更自然流暢，進一步拓展了將想法轉化為可運作軟體的可能性。