今天,我們推出 GPT‑5.3‑Codex‑Spark 的研究預覽版。這是 GPT‑5.3‑Codex 的小型版本,也是我們首款專為即時程式碼編寫設計的模型。Codex-Spark 針對近乎即時的體驗進行最佳化,在維持真實世界程式開發能力的同時,生成速度最高可提升 15 倍。
今年 1 月,我們宣布與 Cerebras 合作,而 Codex-Spark 就是這項計畫的第一個里程碑。我們將 Codex-Spark 以研究預覽形式提供給 ChatGPT Pro 使用者,讓開發者能及早開始試用。同時,我們正與 Cerebras 合作,提升資料中心容量、強化端到端體驗,並部署更大型的前沿模型。
我們最新的前沿模型在執行長時間任務方面表現尤其亮眼,能在無需介入的情況下,自主運行數小時、數天甚至數星期。Codex-Spark 是我們首款專為即時使用 Codex 而設計的模型,可進行精準修改、重塑邏輯或最佳化介面,當下就能看到結果。隨著 Codex-Spark 推出,Codex 系列不但能應付長時間的複雜大型專案,也能快速完成眼前的小任務。我們會從開發者的實際使用情況中汲取經驗,納入各方回饋意見,並逐步擴大使用範圍。
目前推出的 Codex-Spark 提供 128k 上下文視窗,並僅支援文字輸入。在研究預覽期間,Codex-Spark 設有獨立的速率限制,且使用量不會計入標準速率限制。不過在需求高峰時,為確保整體服務穩定性,系統可能會出現速度變慢或暫時排隊的情況。
Codex-Spark 已針對互動式工作進行最佳化,在這類情境中,不只模型的智慧很重要,反應速度也同樣關鍵。你可以把模型當成即時協作的夥伴,在它執行任務時隨時中斷或重新調整方向,快速來回修改,不必等到整個部署流程跑完。由於 Codex-Spark 主要為速度而調校,預設工作方式較為精簡:只會進行必要且精準的修改,除非你主動要求,否則不會自動執行測試。
Codex-Spark 是一款能力完整、體量較小的模型,特別針對快速推論進行最佳化。在 SWE-Bench Pro 與 Terminal-Bench 2.0 這兩項評估代理式軟體工程能力的基準測試中,GPT‑5.3‑Codex‑Spark 整體表現略低於 GPT‑5.3‑Codex,但完成任務所需的時間大幅縮短。
持續時間估算為以下各項總和:(1) 輸出生成時間(輸出 Token ÷ 取樣速度)、(2) 預填時間(預填 Token ÷ 預填速度)、(3) 工具執行總時間,以及 (4) 整體網路開銷。
在訓練 Codex-Spark 的過程中,我們發現,要實現真正流暢的即時協作,光是提升模型速度還不夠,還必須降低整個請求與回應流程的延遲。因此,我們在系統層面進行端到端的延遲改善,讓所有模型都能受益。在底層架構上,我們精簡了從用戶端到伺服器再返回的串流流程,重寫推論堆疊的關鍵元件,並調整工作階段初始化方式,讓首個可見 Token 更快顯示,同時在你反覆修改時保持回應順暢。透過導入持久 WebSocket 連線,以及針對 Responses API 的最佳化,我們將每次客戶端與伺服器往返的額外開銷降低 80%、每個 Token 的開銷降低 30%,並把首個 Token 顯示的等待時間縮短 50%。無論使用哪個模型,你都能感受到整體 Codex 體驗更即時、更順暢。
Codex-Spark 運行於 Cerebras 的 Wafer Scale Engine 3(在新視窗中開啟)。這是一款專為高速推論設計的 AI 加速器,為 Codex 提供以低延遲為優先的服務層級。我們與 Cerebras 合作,將這條低延遲路徑整合進與其他模型共用的生產服務架構,使其能在 Codex 中無縫運作,也為未來模型的部署做好準備。
「GPT-5.3-Codex-Spark 最讓我們感到振奮的是,能夠與 OpenAI 及開發者社群攜手探索快速推論所開啟的可能性:全新的互動模式、全新的應用情境,以及截然不同的模型體驗。這個預覽版本只是起點。」
GPU 仍然是我們訓練與推論流程的核心基礎,能在大規模使用情境下提供具成本效益的 Token。Cerebras 則補足這個基礎,在需要極低延遲的工作流程中表現出色,進一步縮短端到端回應時間,讓你在反覆調整時感覺更靈敏。
Codex-Spark 今日以研究預覽形式推出,提供給所有 ChatGPT Pro 使用者,可在最新版本的 Codex 應用程式、CLI 與 VS Code 擴充功能中使用。該模型在專用的低延遲硬體上運行,因此設有獨立的速率限制,並可能在研究預覽期間依需求調整。此外,我們也透過 API 向少數設計合作夥伴開放 Codex-Spark,了解開發者希望如何將其整合進產品之中。接下來幾週,我們會在真實使用情境下持續精進整合體驗,並逐步擴大開放範圍。
Codex-Spark 目前僅支援文字模式,具備 128k 上下文視窗,是超高速模型系列中的首個成員。隨著我們與開發者社群進一步探索快速模型在程式開發上的優勢,未來將推出更多能力,包括更大型的模型、更長的上下文,以及多模態輸入。
Codex-Spark 採用與主線模型相同的安全訓練,包括與網路安全相關的訓練內容。我們依照標準部署流程進行評估,包含網路安全與其他能力的基準測試,並確認該模型不具備達到應變整備框架中網路安全「高能力」門檻的合理可能性。
Codex-Spark 是邁向雙模式 Codex 的第一步:一方面支援長時間推理與執行,另一方面提供即時協作,讓你能快速反覆調整。未來這兩種模式會逐漸融合,Codex 可以在維持緊密互動的同時,把長時間任務交給背景子智慧體處理,或在需要同時兼顧廣度與速度時,將任務並行分派給多個模型,讓你不必一開始就選定單一模式。
隨著模型能力持續提升,互動速度逐漸成為明顯的瓶頸。超高速推論能縮短這個來回過程,讓 Codex 使用起來更自然流暢,進一步拓展了將想法轉化為可運作軟體的可能性。


