메인 콘텐츠로 건너뛰기
OpenAI

2026년 6월 26일

제품릴리스

Previewing GPT‑5.6 Sol: a next-generation model

로딩 중...

We're beginning a limited preview of the GPT‑5.6 series: Sol, our flagship model; Terra, a balanced model for everyday work; and Luna, a fast and affordable model. Terra has competitive performance to GPT‑5.5 while being 2x cheaper and Luna brings strong capability at our lowest cost.

GPT‑5.6 Sol launches with our most robust safety stack to date. We strengthened protections for higher-risk activity, sensitive cyber requests, and repeated misuse, and spent multiple weeks finding weaknesses, pressure-testing our system, and hardening it against real-world attacks.

We believe in broad access, and we plan to make GPT‑5.6 Sol, Terra, and Luna generally available in the coming weeks. As part of our ongoing engagement with the U.S. government, we previewed our plans and the models’ capabilities ahead of today’s launch. At their request, we are starting with a limited preview for a small group of trusted partners whose participation has been shared with the government, before releasing more broadly. During this preview, we will continue testing and coordinating closely with partners as we work toward broader availability. We don’t believe this kind of government access process should become the long-term default. It keeps the best tools from users, developers, enterprises, cyber defenders, and global partners who need them. We are taking this short-term step because we believe it is the strongest path to broader availability in the coming weeks, while we work with the Administration to develop the cyber Executive Order framework and a repeatable process for future model releases.

Capabilities

GPT‑5.6 Sol is our strongest model yet. To give a preview of model performance, we share a set of evaluations highlighting improved agentic capabilities in coding, biology, and cybersecurity, with additional safety and preparedness evaluations available in our system card(새 창에서 열기). We will share an expanded suite of evaluation results when we make the model broadly available.

With GPT‑5.6, we’re introducing a new max reasoning effort to give Sol the most time to reason deeply. Additionally, we’re introducing a new ultra mode that goes beyond the capabilities of a single agent by leveraging subagents to accelerate complex work.

For coding workflows, GPT‑5.6 Sol sets a new state of the art on Terminal‑Bench 2.1, which tests command-line workflows requiring planning, iteration, and tool coordination.

GPT‑5.6 Sol also shows broad improvements in biology workflows. On GeneBench v1, which evaluates long-horizon genomics and quantitative-biology analyses, it achieves stronger results than GPT‑5.5 while using fewer tokens.

GPT‑5.6 Sol is our most capable model yet for cybersecurity. It shifts the performance-efficiency frontier for long-horizon security tasks including vulnerability research and exploitation. On ExploitBench², GPT‑5.6 Sol is competitive with Mythos Preview using only ~1/3 of the output tokens. On ExploitGym(새 창에서 열기)3, a benchmark created by UC Berkeley researchers in collaboration with OpenAI and other frontier labs, GPT‑5.6 Sol, Terra, and Luna models all demonstrate strong improvements in cyber capabilities as we increase reasoning.

Stronger cyber capabilities with stronger safeguards

We developed GPT‑5.6 Sol, Terra and Luna with our most robust safeguards to date, with configurations matched to each model’s capabilities. As the model becomes more capable, we design safeguards to increasingly hold up to real-world adversarial pressure while preserving access to legitimate work such as code review, vulnerability research, patch development, debugging, security education, and defensive testing. Our goal is to make prohibited offensive activity more difficult, uncertain, and detectable without unnecessarily limiting those beneficial uses. Based on our assessment of the model and safeguards, we expect substantial benefit for legitimate defensive work, while meaningfully constraining prohibited offensive use.

GPT‑5.6 Sol is better at helping people find and fix vulnerabilities than reliably carrying out end-to-end attacks. As these capabilities continue to advance, our priority is to make sure they reach and benefit defenders, who can use these tools to find weaknesses, develop patches, and strengthen systems more broadly.

GPT‑5.6 Sol does not cross the Cyber Critical threshold under our Preparedness Framework. In evaluations involving Chromium and Firefox, it identified bugs and exploitation primitives—the building blocks of an exploit—but did not autonomously produce a functional full-chain exploit under the conditions tested. Still, benchmark thresholds cannot capture every way a model may be used or combined with other tools. That uncertainty, along with the model’s broader step change in capabilities, is why we are pairing the model’s increased capabilities with stronger safeguards and a phased release. We share more details about our safeguards in the GPT‑5.6 Preview system card(새 창에서 열기).

A layered safeguard stack

No single safeguard is sufficient against determined or adaptive misuse. Across the GPT‑5.6 preview, we use layered safeguards, with exact configurations varying across models, and pressure-test them for real-world attacks. These include protections trained into the model, real-time checks during generation, account-level signals, differentiated access, monitoring, enforcement, and continued testing.

GPT‑5.6 is trained to refuse prohibited cyber assistance, including when users attempt to disguise their intent or jailbreak the model. These model-level safeguards establish the first boundary around what the model should and should not help with.

Real-time cyber and biology misuse classifiers provide another layer by evaluating output as it is generated. For higher risk cases, if they detect a potential violation, the generation may be paused while a larger reasoning model reviews the conversation and its context. If the output is assessed as disallowed, it is withheld before it reaches the user.

Flagged activity can also trigger account-level review across relevant conversations and risk signals, consistent with our terms and policies around content retention and review. Looking beyond a single conversation helps our systems distinguish persistent malicious behavior from legitimate dual-use security work, where similar technical concepts may appear in very different contexts.

Together, these layers make the overall approach more robust than any one safeguard on its own. Model behavior reduces the likelihood of harmful responses, real-time systems can intervene during generation, account-level review can identify broader patterns, and differentiated access preserves important defensive work without making the most sensitive capabilities broadly available by default.

Especially during the preview, users may encounter safeguards that block or refuse some requests. Other requests may take longer because generation is paused for additional review. Safeguards may occasionally intervene on legitimate work, particularly in dual-use areas where defensive and offensive activity can initially look similar.

That is part of what the preview is designed to test. We want to understand not only whether the safeguards constrain misuse, but whether legitimate users can still complete normal work reliably and efficiently. Feedback during the preview will help us reduce unnecessary blocks and delays, improve how the safeguards interpret context, and create a smoother experience before wider release.

We are also working with enterprise customers on longer-term approaches—including privacy-preserving detection, customer-operated safety controls, and access calibrated to the risk of a customer, user, or workload—to advance safety while supporting enterprise privacy requirements.

자동화된 레드팀 테스트로 견고성 개선

공격자가 전술을 바꾸더라도 안전장치는 계속 효과적으로 작동해야 합니다. 이미 알려진 공격만 막을 수 있는 보호 체계만으로는 프런티어 모델을 충분히 보호할 수 없습니다.

그래서 OpenAI는 그 어느 때보다 많은 AI 역량과 컴퓨팅 자원을 안전성 강화에 투입하고 있습니다. 자체 모델을 활용해 취약점을 찾아내고, 안전장치를 더 빠르게 개선하기 위해서입니다. 특히 특정 상황에만 적용되는 공격이 아니라, 다양한 프롬프트와 환경에서 통할 수 있는 범용 탈옥 기법을 찾아내기 위한 자동화된 레드팀 테스트에 A100 GPU 환산 기준 70만 시간 이상의 컴퓨팅 자원을 투입했습니다. 이러한 더 어렵고 일반화된 공격에 집중함으로써, 이미 알려진 실패 사례를 넘어 안전장치의 견고함을 검증할 수 있었습니다. 또한 사람만으로는 다루기 어려운 훨씬 다양한 공격 패턴을 탐색하고, 실패 양상을 더 일찍 발견하며, 취약점을 찾아 해결하기까지 걸리는 시간도 크게 단축할 수 있었습니다.

자동화된 레드팀 테스트와 함께, OpenAI는 외부 전문 테스터들과 협력해 대규모 전문가 레드팀 테스트도 진행했으며, 이러한 평가는 프리뷰 기간에도 계속 이어질 예정입니다. 전문가 레드팀 테스트는 시스템이 예상하지 못한 방식으로 모델을 오용하려는 전문가를 가정해 안전장치를 검증함으로써, 자동화된 테스트만으로는 확인하기 어려운 위험까지 점검하는 역할을 합니다.

어떤 평가도 모든 제품 구성이나 다단계 공격, 실제 환경의 워크플로를 완벽하게 반영할 수는 없습니다. 따라서 OpenAI는 새롭게 발견된 탈옥 기법을 신속하게 재현하고, 평가하고, 우선순위를 정해 대응하는 체계를 운영하고 있습니다. 또한 이러한 사례를 지속적인 평가에 반영해 앞으로 유사한 취약점에 대해서도 계속 검증할 수 있도록 하고 있습니다.

제공 여부 및 가격

프리뷰 기간에는 GPT‑5.6 모델을 신뢰할 수 있는 일부 파트너와 조직을 대상으로 API와 Codex를 통해 먼저 제공합니다. 이후에는 ChatGPT, Codex, API를 사용하는 더 많은 사용자가 이용할 수 있도록 제공 범위를 확대할 계획입니다.

GPT‑5.6과 함께 도입된 새로운 모델 명명 체계에서는 숫자가 모델의 세대를 나타내고, Sol, Terra, Luna는 각각 독립적인 개발 주기에 따라 발전하는 지속적인 성능 등급을 나타냅니다. 이를 통해 사용자와 개발자는 지능, 속도, 비용 측면에서 자신의 필요에 맞는 모델을 더욱 명확하게 선택할 수 있습니다.

GPT‑5.6은 세 가지 모델 크기로 제공되며, 가격은 100만 토큰 기준입니다. Sol은 입력 $5 / 출력 $30, Terra는 입력 $2.50 / 출력 $15, Luna는 입력 $1 / 출력 $6입니다. GPT‑5.6에는 더욱 예측 가능한 프롬프트 캐싱도 도입되며, 명시적인 캐시 중단 지점과 최소 30분의 캐시 유지 시간을 지원합니다. GPT‑5.6 및 이후 모델부터는 캐시 쓰기 비용이 캐시를 사용하지 않은 입력 요금의 1.25배로 청구되며, 캐시 읽기에는 기존과 동일하게 캐시된 입력에 대해 90% 할인 혜택이 적용됩니다.

또한 7월에는 Cerebras에서 초당 최대 750토큰의 속도로 GPT‑5.6 Sol을 제공할 예정입니다. 이를 통해 전례 없는 속도로 프런티어 AI 성능을 고객에게 제공합니다. 초기에는 서비스 용량을 확대하는 동안 일부 고객에게만 제공됩니다.

이번 프리뷰를 통해 계속해서 배우고 개선해 나가는 한편, GPT‑5.6 Sol, Terra, Luna를 더 많은 사용자에게 곧 제공할 수 있기를 기대합니다.


1. 지연 시간과 API 비용은 실제 운영 환경에서의 모델 동작을 바탕으로 오프라인 시뮬레이션을 수행해 추정했습니다. 이러한 추정에는 도구 호출 세부 정보, 샘플링된 토큰, 입력 토큰이 반영됩니다. 실제 결과는 시뮬레이션에서 반영하지 못한 다양한 요인에 따라 크게 달라질 수 있습니다. 지연 시간은 빠른 API 속도를 기준으로, 비용은 일반 API 요금을 기준으로 시뮬레이션했습니다.

2. 모든 모델은 5개의 시드와 추론 연속성을 적용한 ExploitBench API 평가 환경에서 평가했습니다.

3. ExploitGym은 공개 API보다 더 빠르게 응답하는 알파 API에서 실행한 뒤, 결과를 공개 API의 성능에 맞춰 다시 환산했습니다. 이 과정에서 일부 추정 지연 시간은 실제 평가에서는 2시간 및 6시간 제한을 준수했더라도, 공개 API 기준으로 환산하면 해당 제한을 초과하는 것으로 나타날 수 있습니다. 시간이 중요한 작업에는 API의 우선 처리와 Codex의 고속 모드를 이용할 수 있습니다.

4. 출력 토큰 수, 지연 시간 또는 비용이 보고되지 않은 모델은 가로 점선으로 표시했습니다.

작성자

OpenAI