Previewing GPT‑5.6 Sol: a next-generation model
We're beginning a limited preview of the GPT‑5.6 series: Sol, our flagship model; Terra, a balanced model for everyday work; and Luna, a fast and affordable model. Terra has competitive performance to GPT‑5.5 while being 2x cheaper and Luna brings strong capability at our lowest cost.
GPT‑5.6 Sol launches with our most robust safety stack to date. We strengthened protections for higher-risk activity, sensitive cyber requests, and repeated misuse, and spent multiple weeks finding weaknesses, pressure-testing our system, and hardening it against real-world attacks.
We believe in broad access, and we plan to make GPT‑5.6 Sol, Terra, and Luna generally available in the coming weeks. As part of our ongoing engagement with the U.S. government, we previewed our plans and the models’ capabilities ahead of today’s launch. At their request, we are starting with a limited preview for a small group of trusted partners whose participation has been shared with the government, before releasing more broadly. During this preview, we will continue testing and coordinating closely with partners as we work toward broader availability. We don’t believe this kind of government access process should become the long-term default. It keeps the best tools from users, developers, enterprises, cyber defenders, and global partners who need them. We are taking this short-term step because we believe it is the strongest path to broader availability in the coming weeks, while we work with the Administration to develop the cyber Executive Order framework and a repeatable process for future model releases.
GPT‑5.6 Sol is our strongest model yet. To give a preview of model performance, we share a set of evaluations highlighting improved agentic capabilities in coding, biology, and cybersecurity, with additional safety and preparedness evaluations available in our system card(mở trong cửa sổ mới). We will share an expanded suite of evaluation results when we make the model broadly available.
With GPT‑5.6, we’re introducing a new max reasoning effort to give Sol the most time to reason deeply. Additionally, we’re introducing a new ultra mode that goes beyond the capabilities of a single agent by leveraging subagents to accelerate complex work.
For coding workflows, GPT‑5.6 Sol sets a new state of the art on Terminal‑Bench 2.1, which tests command-line workflows requiring planning, iteration, and tool coordination.
GPT‑5.6 Sol also shows broad improvements in biology workflows. On GeneBench v1, which evaluates long-horizon genomics and quantitative-biology analyses, it achieves stronger results than GPT‑5.5 while using fewer tokens.
GPT‑5.6 Sol is our most capable model yet for cybersecurity. It shifts the performance-efficiency frontier for long-horizon security tasks including vulnerability research and exploitation. On ExploitBench², GPT‑5.6 Sol is competitive with Mythos Preview using only ~1/3 of the output tokens. On ExploitGym(mở trong cửa sổ mới)3, a benchmark created by UC Berkeley researchers in collaboration with OpenAI and other frontier labs, GPT‑5.6 Sol, Terra, and Luna models all demonstrate strong improvements in cyber capabilities as we increase reasoning.
We developed GPT‑5.6 Sol, Terra and Luna with our most robust safeguards to date, with configurations matched to each model’s capabilities. As the model becomes more capable, we design safeguards to increasingly hold up to real-world adversarial pressure while preserving access to legitimate work such as code review, vulnerability research, patch development, debugging, security education, and defensive testing. Our goal is to make prohibited offensive activity more difficult, uncertain, and detectable without unnecessarily limiting those beneficial uses. Based on our assessment of the model and safeguards, we expect substantial benefit for legitimate defensive work, while meaningfully constraining prohibited offensive use.
GPT‑5.6 Sol is better at helping people find and fix vulnerabilities than reliably carrying out end-to-end attacks. As these capabilities continue to advance, our priority is to make sure they reach and benefit defenders, who can use these tools to find weaknesses, develop patches, and strengthen systems more broadly.
GPT‑5.6 Sol does not cross the Cyber Critical threshold under our Preparedness Framework. In evaluations involving Chromium and Firefox, it identified bugs and exploitation primitives—the building blocks of an exploit—but did not autonomously produce a functional full-chain exploit under the conditions tested. Still, benchmark thresholds cannot capture every way a model may be used or combined with other tools. That uncertainty, along with the model’s broader step change in capabilities, is why we are pairing the model’s increased capabilities with stronger safeguards and a phased release. We share more details about our safeguards in the GPT‑5.6 Preview system card(mở trong cửa sổ mới).
No single safeguard is sufficient against determined or adaptive misuse. Across the GPT‑5.6 preview, we use layered safeguards, with exact configurations varying across models, and pressure-test them for real-world attacks. These include protections trained into the model, real-time checks during generation, account-level signals, differentiated access, monitoring, enforcement, and continued testing.
GPT‑5.6 is trained to refuse prohibited cyber assistance, including when users attempt to disguise their intent or jailbreak the model. These model-level safeguards establish the first boundary around what the model should and should not help with.
Real-time cyber and biology misuse classifiers provide another layer by evaluating output as it is generated. For higher risk cases, if they detect a potential violation, the generation may be paused while a larger reasoning model reviews the conversation and its context. If the output is assessed as disallowed, it is withheld before it reaches the user.
Flagged activity can also trigger account-level review across relevant conversations and risk signals, consistent with our terms and policies around content retention and review. Looking beyond a single conversation helps our systems distinguish persistent malicious behavior from legitimate dual-use security work, where similar technical concepts may appear in very different contexts.
Together, these layers make the overall approach more robust than any one safeguard on its own. Model behavior reduces the likelihood of harmful responses, real-time systems can intervene during generation, account-level review can identify broader patterns, and differentiated access preserves important defensive work without making the most sensitive capabilities broadly available by default.
Especially during the preview, users may encounter safeguards that block or refuse some requests. Other requests may take longer because generation is paused for additional review. Safeguards may occasionally intervene on legitimate work, particularly in dual-use areas where defensive and offensive activity can initially look similar.
That is part of what the preview is designed to test. We want to understand not only whether the safeguards constrain misuse, but whether legitimate users can still complete normal work reliably and efficiently. Feedback during the preview will help us reduce unnecessary blocks and delays, improve how the safeguards interpret context, and create a smoother experience before wider release.
We are also working with enterprise customers on longer-term approaches—including privacy-preserving detection, customer-operated safety controls, and access calibrated to the risk of a customer, user, or workload—to advance safety while supporting enterprise privacy requirements.
Các biện pháp bảo vệ cũng cần duy trì hiệu quả khi kẻ tấn công thay đổi chiến thuật. Một cơ chế bảo vệ chỉ hiệu quả với một tập hợp cố định các cuộc tấn công đã biết là chưa đủ vững chắc cho một mô hình tiên phong.
Vì vậy, chúng tôi đang đầu tư nhiều trí tuệ và năng lực tính toán hơn bao giờ hết cho an toàn, dùng chính các mô hình của mình để tìm điểm yếu và cải thiện biện pháp bảo vệ nhanh hơn. Chúng tôi đã dành hơn 700.000 giờ GPU tương đương A100 cho kiểm thử red team tự động các phương thức bẻ khóa phổ biến (universal jailbreak): những cuộc tấn công có thể hiệu quả trên nhiều câu lệnh hoặc bối cảnh, chứ không chỉ trong một phạm vi hẹp. Việc tập trung vào những cuộc tấn công khó hơn và tổng quát hơn này giúp chúng tôi kiểm tra các biện pháp bảo vệ vượt ra ngoài một tập hợp cố định các lỗi đã biết. Cách làm này cũng cho phép chúng tôi khám phá nhiều hình thức tấn công hơn rất nhiều so với chỉ kiểm thử thủ công, nhận diện các mẫu lỗi sớm hơn và rút ngắn thời gian từ khi phát hiện lỗ hổng đến khi khắc phục.
Bên cạnh kiểm thử red team tự động, chúng tôi đã làm việc với các bên kiểm thử thứ ba để tiến hành kiểm thử đội đỏ quy mô lớn do chuyên gia con người thực hiện, và hoạt động này sẽ tiếp tục trong giai đoạn xem trước. Kiểm thử đội đỏ do con người thực hiện bổ sung cho công việc tự động bằng cách kiểm tra các biện pháp bảo vệ trước những chuyên gia sáng tạo đang cố lạm dụng mô hình theo các cách mà hệ thống của chúng tôi có thể chưa lường trước.
Không đánh giá nào có thể đại diện cho mọi cấu hình sản phẩm, cuộc tấn công nhiều bước hoặc quy trình làm việc trong thực tế. Do đó, chúng tôi duy trì một quy trình phản ứng nhanh để tái tạo, đánh giá, ưu tiên và khắc phục các phương thức bẻ khoá mới được phát hiện, rồi bổ sung chúng vào các đánh giá liên tục để có thể kiểm tra những lỗi tương tự trong tương lai.
Trong giai đoạn xem trước, các mô hình GPT‑5.6 ban đầu sẽ được cung cấp qua API và Codex cho một nhóm đối tác và tổ chức đáng tin cậy được chọn lọc. Chúng tôi dự định sớm cung cấp rộng rãi hơn cho những người dùng ChatGPT, Codex và API.
Trong hệ thống đặt tên mới được giới thiệu cùng GPT‑5.6, con số là thế hệ của mô hình, còn Sol, Terra và Luna xác định các tầng năng lực bền vững có thể phát triển theo nhịp riêng. Kết hợp lại, họ mô hình này mang đến cho người dùng và nhà phát triển những lựa chọn rõ ràng hơn về trí tuệ, tốc độ và chi phí.
GPT‑5.6 được định giá theo mỗi 1 triệu token trên ba kích cỡ mô hình: Sol là $5 đầu vào / $30 đầu ra; Terra là $2,50 đầu vào / $15 đầu ra; và Luna là $1 đầu vào / $6 đầu ra. GPT‑5.6 cũng giới thiệu cơ chế lưu bộ nhớ đệm câu lệnh dễ dự đoán hơn, bao gồm hỗ trợ các điểm ngắt bộ nhớ đệm rõ ràng và thời gian tồn tại tối thiểu 30 phút của bộ nhớ đệm. Đối với GPT‑5.6 và các mô hình đời sau, các tác vụ ghi bộ nhớ đệm sẽ được tính phí bằng 1,25 lần giá dữ liệu đầu vào không ghi nhớ đệm của mô hình đó, trong khi các tác vụ đọc bộ nhớ đệm sẽ tiếp tục được hưởng mức chiết khấu 90% dành cho dữ liệu đầu vào đã lưu vào bộ nhớ đệm.
Chúng tôi cũng sẽ ra mắt GPT‑5.6 Sol trên Cerebras với tốc độ lên tới 750 token mỗi giây vào tháng 7, đưa trí tuệ tiên phong đến với khách hàng ở tốc độ chưa từng có. Quyền truy cập ban đầu sẽ được giới hạn cho một số khách hàng chọn lọc trong bối cảnh chúng tôi đang mở rộng năng lực hệ thống.
Chúng tôi rất hào hứng tiếp tục học hỏi từ giai đoạn thử nghiệm này và sớm đưa GPT‑5.6 Sol, Terra và Luna đến với nhiều người hơn.
1. Chúng tôi ước tính độ trễ và chi phí API bằng cách xem xét hành vi vận hành thực tế của các mô hình, rồi mô phỏng ngoại tuyến. Các ước tính này tính đến chi tiết lệnh gọi công cụ, token được lấy mẫu và token đầu vào. Kết quả thực tế có thể khác biệt đáng kể và phụ thuộc vào nhiều yếu tố không được ghi nhận trong mô phỏng của chúng tôi. Chúng tôi giả lập độ trễ ở tốc độ API nhanh và chi phí theo giá API thông thường.
2. Tất cả các mô hình được đánh giá bằng bộ khung API ExploitBench với 5 seed và tính liên tục suy luận.
3. Chúng tôi chạy ExploitGym trên API alpha của mình, vốn xuất phản hồi nhanh hơn API công khai, rồi co giãn lại để khớp với API công khai. Khi co giãn độ trễ theo tốc độ dự kiến của API công khai, một số độ trễ ước tính vượt quá giới hạn thời gian 2 giờ và 6 giờ, dù trong lần chạy đánh giá các giới hạn này đã được tuân thủ đúng. Để có tốc độ nhanh hơn cho công việc nhạy cảm về thời gian, chúng tôi cung cấp xử lý ưu tiên trong API và chế độ nhanh trong Codex.
4. Các mô hình không có báo cáo về token đầu ra, độ trễ hoặc chi phí được biểu diễn bằng các đường chấm ngang.


