メインコンテンツにスキップ
OpenAI

2026年2月12日

製品リリース企業

GPT‑5.3‑Codex‑Spark のご紹介

Codex でのリアルタイムコーディング向けに設計された高速モデルです。

読み込んでいます...

本日、GPT‑5.3‑Codex の小型版であり、リアルタイムコーディング向けに設計された当社初のモデル GPT‑5.3‑Codex‑Spark の研究プレビューを公開します。Codex-Spark は、1月に発表した Cerebras とのパートナーシップにおける最初のマイルストーンです。Codex-Spark は、超低レイテンシのハードウェア上で提供された場合に、ほぼ瞬時に応答していると感じられるよう最適化されています。実運用のコーディングタスクに対応できる高い性能を維持しながら、毎秒1000トークン以上の生成速度を実現します。

開発者の皆さまが早期に試用できるよう、Codex-Spark を Cerebras 基盤上で、ChatGPT Pro ユーザー向けに研究プレビューとして提供します。並行して、Cerebras と連携し、データセンター容量の拡張、エンドツーエンドのユーザー体験の強化、さらにより大規模なフロンティアモデルの展開を進めていきます。

当社の最新フロンティアモデルは、長時間にわたるタスクを自律的に実行する点で特に高い性能を示しています。人の介入なしで、数時間から数日、場合によっては数週間にわたり動作を継続できます。Codex-Spark は、Codex とリアルタイムに連携するために特化して設計された当社初のモデルです。的確な編集やロジックの再構成、インターフェースの改善を行い、その結果を即座に確認できます。Codex-Spark の登場により、Codex は、長期的で大規模なタスクと、その場で素早く完了させる作業の両方に対応できるようになりました。今後、提供範囲を拡大しながら、開発者の皆さまの利用状況から学び、フィードバックを製品改善に反映していきます。

提供開始時点では、Codex-Spark は128k のコンテキストウィンドウに対応し、テキスト入力のみに対応します。研究プレビュー期間中は、Codex-Spark 専用のレート制限が適用されます。また、その利用分は通常のレート制限には含まれません。需要が高い場合には、ユーザー間の安定性を確保するため、アクセスが制限されたり、一時的に順番待ちが発生したりすることがあります。

スピードと性能

Codex-Spark は、性能と同じくらい応答速度が重要となるインタラクティブな作業向けに最適化されています。リアルタイムの共同作業者のようにモデルとやり取りできます。処理中でも中断や方向転換が可能で、処理の完了を待たずに素早く試行錯誤を重ねられます。スピードを重視して設計されているため、Codex-Spark の標準的な動作は軽量です。必要最小限の的確な編集を行い、指示がない限りテストを自動実行しません。

コーディング

Codex-Spark は、高速推論に最適化された高性能な小型モデルです。エージェント型ソフトウェアエンジニアリング能力を評価するベンチマークである SWE-Bench Pro および Terminal-Bench 2.0 において、GPT‑5.3‑Codex‑Spark は、GPT‑5.3‑Codex と比べて、短時間でタスクを完了しながらも高い性能を示しています。

所要時間は、(1) 出力生成時間(出力トークン ÷ サンプリング速度)、(2) プリフィル時間(プリフィルトークン ÷ プリフィル速度)、(3) ツール実行時間の合計、(4) ネットワークオーバーヘッドの合計を合算した値として推定しています。

すべてのモデルにおけるレイテンシの改善

Codex-Spark の学習過程で、リアルタイムでの共同作業においては、モデル自体の速度だけでは十分ではないことが明らかになりました。リクエストからレスポンスまでのパイプライン全体でレイテンシを削減する必要がありました。そこで、すべてのモデルに適用される基盤部分において、エンドツーエンドのレイテンシ改善を実施しました。内部では、クライアントとサーバー間のレスポンスのストリーミング処理を最適化し、推論スタックの主要部分を書き直し、セッション初期化の仕組みも見直しました。これにより、最初のトークンがより早く表示され、反復作業中も Codex の応答性が維持されます。永続的な WebSocket 接続の導入と Responses API 内の最適化により、クライアント/サーバー間の往復ごとのオーバーヘッドを80%、トークンごとのオーバーヘッドを30%、最初のトークンが表示されるまでの時間を50%削減しました。WebSocket 経路は Codex-Spark では既定で有効化されており、まもなくすべてのモデルで既定設定となる予定です。

Cerebras 基盤上で提供

Codex-Spark は、Cerebras の Wafer Scale Engine 3(新しいウィンドウで開く) 上で動作します。これは高速推論向けに設計された AI アクセラレーターで、Codex に低レイテンシを重視したサービング環境を提供します。Cerebras と連携し、この低レイテンシ経路を既存の本番サービング基盤に統合しました。これにより、Codex 全体でシームレスに動作し、将来のモデルにも対応できる構成となっています。

「GPT-5.3-Codex-Spark について私たちが最も期待しているのは、OpenAI および開発者コミュニティと連携し、高速推論によって実現し得る、新たなインタラクションの形やユースケース、そしてこれまでとは異なるモデル体験を共に探求できることです。このプレビューはあくまで始まりにすぎません。」
— Cerebras 共同創業者兼 CTO、Sean Lie 氏

GPU は、学習および推論パイプライン全体の基盤として引き続き重要な役割を担っており、幅広い用途において高いコスト効率を実現しています。Cerebras は、極めて低いレイテンシが求められるワークフローで高い性能を発揮し、この基盤を補完します。これによりエンドツーエンドの処理サイクルが短縮され、反復作業時の Codex の応答性が向上します。GPU と Cerebras を単一のワークロードで組み合わせることで、最良の性能を実現できます。

提供状況と詳細

Codex-Spark は本日より、Codex アプリ、CLI、VS Code 拡張機能の最新バージョンにおいて、ChatGPT Pro ユーザー向けに研究プレビューとして提供を開始します。専用の低レイテンシハードウェア上で動作するため、利用には別途レート制限が適用されます。研究プレビュー期間中は、需要に応じてこの制限が調整される場合があります。さらに、開発者が Codex-Spark を自社製品へどのように統合したいかを把握するため、少数のデザインパートナー向けに API でも提供します。実際のワークロードで統合の最適化を進めながら、今後数週間で提供範囲を拡大していきます。

現時点では、Codex-Spark は128kのコンテキストウィンドウに対応するテキスト専用モデルであり、超高速モデル群の第一弾です。開発者コミュニティとの検証を通じて、高速モデルがコーディングで真価を発揮する領域を明らかにしながら、より大規模なモデルや、さらに長いコンテキスト、マルチモーダル入力などの機能拡張を順次導入していきます。

Codex-Spark には、サイバー関連分野を含め、当社の主力モデルと同様の安全対策に関する学習が適用されています。Codex-Spark は、標準のデプロイメントプロセスに基づいて評価されています。このプロセスには、サイバー分野を含む各種能力に関するベースライン評価が含まれます。その結果、サイバーセキュリティおよびバイオ分野における高い能力について、当社の Preparedness Framework が定めるしきい値に達する現実的な可能性はないと判断しました。

今後の展開

Codex-Spark は、2つの補完的なモードを備えた Codex に向けた第一歩です。長期的な推論と実行を担うモードと、迅速な反復を支えるリアルタイム共同作業モードを想定しています。将来的には、これらのモードは連携しながら動作します。Codex は、インタラクティブな作業サイクルを維持しつつ、長時間にわたる処理をバックグラウンドのサブエージェントに委任できます。また、網羅性や処理速度が求められる場合には、複数のモデルへ並列にタスクを分散できます。そのため、あらかじめ単一のモードを選択する必要はありません。

モデルの性能が向上するほど、インタラクションの速度が明確な制約要因となります。超高速推論により、この作業サイクルが短縮されます。その結果、Codex の操作がより自然になり、アイデアを実際に動作するソフトウェアへと形にする可能性が広がります。

著者

OpenAI