Aqbeż għall-kontenut prinċipali
OpenAI

26 ta’ Ġunju 2026

ProdottRilaxx

Preview ta’ GPT‑5.6 Sol: mudell tal-ġenerazzjoni li jmiss

Qed jillowdja…

Qed nibdew preview limitat tas-serje GPT‑5.6: Sol, il-mudell flagship tagħna; Terra, mudell ibbilanċjat għax-xogħol ta’ kuljum; u Luna, mudell mgħaġġel u affordabbli. Terra għandu prestazzjoni kompetittiva ma’ GPT‑5.5 filwaqt li huwa darbtejn irħas, u Luna joffri kapaċità b’saħħitha bl-inqas kost tagħna.

GPT‑5.6 Sol jitnieda bl-aktar stack tas-sikurezza robust tagħna sal-lum. Saħħaħna l-protezzjonijiet għal attività ta’ riskju ogħla, talbiet sensittivi taċ-ċiber, u użu ħażin ripetut, u qattajna bosta ġimgħat insibu d-dgħufijiet, nittestjaw is-sistema tagħna taħt pressjoni, u nsaħħuha kontra attakki fid-dinja reali.

Aħna nemmnu f’aċċess wiesa’, u qed nippjanaw li nagħmlu GPT‑5.6 Sol, Terra u Luna ġeneralment disponibbli fil-ġimgħat li ġejjin. Bħala parti mill-impenn kontinwu tagħna mal-gvern tal-Istati Uniti, tajna preview tal-pjanijiet tagħna u tal-kapaċitajiet tal-mudelli qabel it-tnedija tal-lum. Fuq talba tagħhom, qed nibdew b’preview limitat għal grupp żgħir ta’ msieħba fdati li l-parteċipazzjoni tagħhom ġiet kondiviża mal-gvern, qabel ma noħorġuh b’mod usa’. Matul dan il-preview, se nkomplu nittestjaw u nikkoordinaw mill-qrib mas-sħab waqt li naħdmu lejn disponibbiltà usa’. Ma nemmnux li dan it-tip ta’ proċess ta’ aċċess għall-gvern għandu jsir in-norma fit-tul. Dan iżomm l-aqwa għodod ’il bogħod mill-utenti, l-iżviluppaturi, l-intrapriżi, id-difensuri ċibernetiċi u sħab globali li għandhom bżonnhom. Qed nieħdu dan il-pass għal żmien qasir għax nemmnu li huwa l-aħjar triq għal disponibbiltà usa’ fil-ġimgħat li ġejjin, waqt li naħdmu mal-Amministrazzjoni biex niżviluppaw il-qafas tal-Ordni Eżekuttiva dwar iċ-ċiber u proċess ripetibbli għal rilaxxi futuri ta’ mudelli.

Kapaċitajiet

GPT‑5.6 Sol huwa l-aktar mudell b’saħħtu tagħna s’issa. Biex nagħtu preview tal-prestazzjoni tal-mudell, naqsmu sett ta’ evalwazzjonijiet li jenfasizzaw kapaċitajiet aġentiċi mtejba fil-kodifikazzjoni, il-bijoloġija u ċ-ċibersigurtà, b’evalwazzjonijiet addizzjonali tas-sikurezza u t-tħejjija disponibbli fil-kard tas-sistema(jinfetaħ f’tieqa ġdida) tagħna. Se naqsmu sett estiż ta’ riżultati tal-evalwazzjoni meta nagħmlu l-mudell disponibbli b’mod usa’.

Ma’ GPT‑5.6, qed nintroduċu sforz ta’ raġunament ġdid `max` biex nagħtu lil Sol l-aktar ħin biex jirraġuna fil-fond. Barra minn hekk, qed nintroduċu modalità ġdida `ultra` li tmur lil hinn mill-kapaċitajiet ta’ aġent wieħed billi tuża subaġenti biex tħaffef xogħol kumpless.

Għall-workflows tal-kodifikazzjoni, GPT‑5.6 Sol jistabbilixxi livell ġdid tal-aqwa teknoloġija fuq Terminal‑Bench 2.1, li jittestja workflows tal-linja tal-kmand li jeħtieġu ppjanar, iterazzjoni u koordinazzjoni tal-għodod.

GPT‑5.6 Sol juri wkoll titjib wiesa’ fil-workflows tal-bijoloġija. Fuq GeneBench v1, li jevalwa analiżijiet tal-ġenomika fit-tul u tal-bijoloġija kwantitattiva, jikseb riżultati aktar b’saħħithom minn GPT‑5.5 filwaqt li juża inqas tokens.

GPT‑5.6 Sol huwa l-aktar mudell kapaċi tagħna s’issa għaċ-ċibersigurtà. Huwa jmexxi ’l quddiem il-fruntiera tal-prestazzjoni u l-effiċjenza għal kompiti ta’ sigurtà fit-tul, inklużi r-riċerka dwar il-vulnerabbiltajiet u l-isfruttament. Fuq ExploitBench², GPT‑5.6 Sol huwa kompetittiv ma’ Mythos Preview billi juża biss madwar 1/3 tat-tokens tal-output. Fuq ExploitGym(jinfetaħ f’tieqa ġdida)3, benchmark maħluq minn riċerkaturi ta’ UC Berkeley b’kollaborazzjoni ma’ OpenAI u laboratorji fruntiera oħra, il-mudelli GPT‑5.6 Sol, Terra u Luna kollha juru titjib qawwi fil-kapaċitajiet ċibernetiċi hekk kif inżidu r-raġunament.

Kapaċitajiet ċibernetiċi aktar b’saħħithom b’salvagwardji aktar b’saħħithom

Żviluppajna GPT‑5.6 Sol, Terra u Luna bl-aktar salvagwardji robusti tagħna sal-lum, b’konfigurazzjonijiet imqabbla mal-kapaċitajiet ta’ kull mudell. Hekk kif il-mudell isir aktar kapaċi, niddisinjaw salvagwardji li dejjem aktar jifilħu għall-pressjoni avversarja fid-dinja reali filwaqt li jippreservaw l-aċċess għal xogħol leġittimu bħal rieżami tal-kodiċi, riċerka dwar vulnerabbiltajiet, żvilupp ta’ patches, debugging, edukazzjoni dwar is-sigurtà u ttestjar difensiv. L-għan tagħna huwa li nagħmlu l-attività offensiva pprojbita aktar diffiċli, inċerta u identifikabbli mingħajr ma nillimitaw bla bżonn dawk l-użi ta’ benefiċċju. Abbażi tal-valutazzjoni tagħna tal-mudell u s-salvagwardji, nistennew benefiċċju sostanzjali għal xogħol difensiv leġittimu, filwaqt li nillimitaw b’mod sinifikanti l-użu offensiv ipprojbit.

GPT‑5.6 Sol huwa aħjar biex jgħin lin-nies isibu u jirranġaw vulnerabbiltajiet milli biex iwettaq b’mod affidabbli attakki mill-bidu sal-aħħar. Hekk kif dawn il-kapaċitajiet ikomplu javvanzaw, il-prijorità tagħna hija li niżguraw li jaslu għand id-difensuri u jkunu ta’ benefiċċju għalihom, biex ikunu jistgħu jużaw dawn l-għodod biex isibu d-dgħufijiet, jiżviluppaw patches u jsaħħu s-sistemi b’mod usa’.

GPT‑5.6 Sol ma jaqbiżx il-limitu Cyber Critical skont il-Preparedness Framework tagħna. F’evalwazzjonijiet li involvew Chromium u Firefox, identifika bugs u primittivi ta’ sfruttament—il-blokki bażiċi ta’ exploit—iżda ma pproduċiex b’mod awtonomu exploit full-chain funzjonali taħt il-kundizzjonijiet ittestjati. Madankollu, il-limiti tal-benchmarks ma jistgħux jaqbdu kull mod kif mudell jista’ jintuża jew jiġi kkombinat ma’ għodod oħra. Dik l-inċertezza, flimkien mal-bidla usa’ pass ’il quddiem fil-kapaċitajiet tal-mudell, hija r-raġuni għaliex qed inqabblu l-kapaċitajiet akbar tal-mudell ma’ salvagwardji aktar b’saħħithom u rilaxx f’fażijiet. Naqsmu aktar dettalji dwar is-salvagwardji tagħna fil-kard tas-sistema tal-Preview ta’ GPT‑5.6(jinfetaħ f’tieqa ġdida).

Stack ta’ salvagwardji f’saffi

L-ebda salvagwardja waħda ma hija biżżejjed kontra użu ħażin determinat jew adattiv. Matul il-preview ta’ GPT‑5.6, nużaw salvagwardji f’saffi, b’konfigurazzjonijiet eżatti li jvarjaw bejn il-mudelli, u nittestjawhom taħt pressjoni għal attakki fid-dinja reali. Dawn jinkludu protezzjonijiet imħarrġa fil-mudell, verifiki f’ħin reali waqt il-ġenerazzjoni, sinjali fil-livell tal-kont, aċċess differenzjat, monitoraġġ, infurzar u ttestjar kontinwu.

GPT‑5.6 huwa mħarreġ biex jirrifjuta assistenza ċibernetika pprojbita, inkluż meta l-utenti jippruvaw jaħbu l-intenzjoni tagħhom jew jagħmlu jailbreak lill-mudell. Dawn is-salvagwardji fil-livell tal-mudell jistabbilixxu l-ewwel konfini madwar dak li l-mudell għandu u m’għandux jgħin bih.

Klassifikaturi f’ħin reali għall-użu ħażin taċ-ċiber u tal-bijoloġija jipprovdu saff ieħor billi jevalwaw l-output waqt li jkun qed jiġi ġġenerat. Għal każijiet ta’ riskju ogħla, jekk jidentifikaw ksur potenzjali, il-ġenerazzjoni tista’ titwaqqaf temporanjament waqt li mudell tar-raġunament akbar jirrieżamina l-konverżazzjoni u l-kuntest tagħha. Jekk l-output jiġi vvalutat bħala mhux permess, jinżamm lura qabel jasal għand l-utent.

Attività mmarkata tista’ wkoll tiskatta rieżami fil-livell tal-kont madwar konverżazzjonijiet rilevanti u sinjali ta’ riskju, f’konformità mat-termini u l-politiki tagħna dwar iż-żamma u r-rieżami tal-kontenut. Meta nħarsu lil hinn minn konverżazzjoni waħda, is-sistemi tagħna jistgħu jiddistingwu aħjar imġiba malizzjuża persistenti minn xogħol leġittimu ta’ sigurtà b’użu doppju, fejn kunċetti tekniċi simili jistgħu jidhru f’kuntesti differenti ħafna.

Flimkien, dawn is-saffi jagħmlu l-approċċ ġenerali aktar robust minn kwalunkwe salvagwardja waħda waħedha. L-imġiba tal-mudell tnaqqas il-probabbiltà ta’ tweġibiet ta’ ħsara, is-sistemi f’ħin reali jistgħu jintervjenu waqt il-ġenerazzjoni, ir-rieżami fil-livell tal-kont jista’ jidentifika mudelli usa’, u l-aċċess differenzjat jippreserva xogħol difensiv importanti mingħajr ma jagħmel l-aktar kapaċitajiet sensittivi disponibbli b’mod wiesa’ awtomatikament.

Speċjalment matul il-preview, l-utenti jistgħu jiltaqgħu ma’ salvagwardji li jimblukkaw jew jirrifjutaw xi talbiet. Talbiet oħra jistgħu jieħdu aktar fit-tul għax il-ġenerazzjoni titwaqqaf temporanjament għal rieżami addizzjonali. Is-salvagwardji jistgħu xi drabi jintervjenu f’xogħol leġittimu, b’mod partikolari f’oqsma b’użu doppju fejn attività difensiva u offensiva jistgħu inizjalment jidhru simili.

Dan huwa parti minn dak li l-preview huwa mfassal biex jittestja. Irridu nifhmu mhux biss jekk is-salvagwardji jillimitawx l-użu ħażin, iżda wkoll jekk utenti leġittimi xorta jistgħux itemmu xogħol normali b’mod affidabbli u effiċjenti. Il-feedback matul il-preview se jgħinna nnaqqsu blokki u dewmien mhux meħtieġa, intejbu kif is-salvagwardji jinterpretaw il-kuntest, u noħolqu esperjenza aktar bla xkiel qabel ir-rilaxx usa’.

Qed naħdmu wkoll ma’ klijenti intrapriżi fuq approċċi aktar fit-tul—inklużi detezzjoni li tippreserva l-privatezza, kontrolli tas-sikurezza mħaddma mill-klijent, u aċċess ikkalibrat skont ir-riskju ta’ klijent, utent jew workload—biex insaħħu s-sikurezza filwaqt li nappoġġaw ir-rekwiżiti tal-privatezza tal-intrapriżi.

Insaħħu r-robustezza b’red teaming awtomatizzat

Is-salvagwardji jeħtieġ ukoll jibqgħu effettivi meta l-attakkanti jadattaw it-tattiċi tagħhom. Protezzjoni li taħdem biss fuq sett fiss ta’ attakki magħrufa mhix robusta biżżejjed għal mudell fruntiera.

Għalhekk qed napplikaw aktar intelliġenza u komputazzjoni minn qatt qabel għas-sikurezza, billi nużaw il-mudelli tagħna stess biex insibu d-dgħufijiet u ntejbu s-salvagwardji aktar malajr. Iddedikajna aktar minn 700,000 siegħa ta’ GPU ekwivalenti għal A100 għal red teaming awtomatizzat immirat biex isib jailbreaks universali: attakki li jistgħu jaħdmu f’ħafna prompts jew kuntesti, mhux biss f’ambjent wieħed dejjaq. Billi ffukajna fuq dawn l-attakki aktar diffiċli u aktar ġenerali, stajna nittestjaw is-salvagwardji lil hinn minn sett fiss ta’ fallimenti magħrufa. Dan jippermettilna wkoll nesploraw ħafna aktar mudelli ta’ attakk milli jista’ jkopri l-ittestjar uman waħdu, nidentifikaw mudelli ta’ falliment aktar kmieni, u nqassru t-triq minn meta nsibu dgħufija sa meta nindirizzawha.

Minbarra r-red teaming awtomatizzat, ħdimna ma’ testers terzi biex inwettqu red teaming estensiv minn esperti umani, li se jkompli matul il-perjodu tal-preview. Ir-red teaming uman jikkomplementa x-xogħol awtomatizzat billi jittestja s-salvagwardji kontra esperti kreattivi li jippruvaw jużaw il-mudell ħażin b’modi li s-sistemi tagħna jistgħu ma jbassrux.

L-ebda evalwazzjoni ma tista’ tirrappreżenta kull konfigurazzjoni ta’ prodott, attakk b’ħafna passi, jew workflow fid-dinja reali. Għalhekk inżommu proċess ta’ rispons rapidu biex nirriproduċu, nivvalutaw, nipprijoritizzaw u nirranġaw jailbreaks ġodda skoperti, imbagħad inżiduhom mal-evalwazzjonijiet kontinwi tagħna sabiex fil-futur inkunu nistgħu nittestjaw kontra fallimenti simili.

Disponibbiltà u prezzijiet

Matul il-preview, il-mudelli GPT‑5.6 inizjalment se jkunu disponibbli permezz tal-API u Codex għal grupp magħżul ta’ msieħba u organizzazzjonijiet fdati. Qed nippjanaw li dalwaqt nagħmluhom disponibbli b’mod usa’ għal nies li jużaw ChatGPT, Codex u l-API.

F’din is-sistema ġdida ta’ ismijiet introdotta ma’ GPT‑5.6, in-numru jidentifika l-ġenerazzjoni ta’ mudell, filwaqt li Sol, Terra u Luna jidentifikaw livelli durabbli ta’ kapaċità li jistgħu javvanzaw bir-ritmu tagħhom stess. Flimkien, il-familja tagħti lin-nies u lill-iżviluppaturi għażliet aktar ċari bejn intelliġenza, veloċità u kost.

GPT‑5.6 għandu prezz għal kull 1M tokens fi tliet daqsijiet ta’ mudell: Sol huwa $5 input / $30 output; Terra huwa $2.50 input / $15 output; u Luna huwa $1 input / $6 output. GPT‑5.6 jintroduċi wkoll caching tal-prompts aktar prevedibbli, inkluż appoġġ għal punti ta’ waqfien tal-cache espliċiti u ħajja minima tal-cache ta’ 30 minuta. Għal GPT‑5.6 u mudelli aktar tard, il-kitbiet fil-cache jiġu ċċarġjati b’1.25x ir-rata tal-input mhux cachejat tal-mudell, filwaqt li l-qari mill-cache jibqa’ jirċievi l-iskont ta’ 90% fuq input cachejat.

Qed inniedu wkoll GPT‑5.6 Sol fuq Cerebras sa 750 tokens kull sekonda f’Lulju, biex inwasslu intelliġenza fruntiera lill-klijenti b’veloċità bla preċedent. L-aċċess inizjalment se jkun limitat għal klijenti magħżula waqt li nkabbru l-kapaċità.

Ninsabu eċċitati li nkomplu nitgħallmu minn dan il-perjodu tal-preview, u li dalwaqt inwasslu GPT‑5.6 Sol, Terra u Luna lil aktar nies.


1. Nistmaw il-latenza u l-kost tal-API billi nħarsu lejn l-imġiba fil-produzzjoni tal-mudelli tagħna, u nissimulaw offline. Dawn l-istimi jqisu d-dettalji tas-sejħiet tal-għodod, it-tokens kampjunati u t-tokens tal-input. Ir-riżultati fid-dinja reali jistgħu jvarjaw sostanzjalment, u jiddependu fuq ħafna fatturi li mhumiex maqbuda fis-simulazzjoni tagħna. Nissimulaw il-latenza b’veloċitajiet tal-API mgħaġġla, u l-kost bi prezzijiet regolari tal-API.

2. Il-mudelli kollha jiġu evalwati bl-użu tal-harness tal-API ta’ ExploitBench b’5 seeds u kontinwità tar-raġunament.

3. Ħaddimna ExploitGym fuq l-API alpha tagħna, li toħroġ it-tweġibiet aktar malajr mill-API pubblika tagħna, u mbagħad irriskejljajna biex taqbel mal-API pubblika tagħna. Meta nirriskalaw il-latenzi għall-veloċitajiet mistennija għall-API pubblika tagħna, dan iwassal biex xi latenzi stmati jaqbżu l-limiti ta’ ħin ta’ 2 sigħat u 6 sigħat, minkejja li fil-ġirja tal-evalwazzjoni ġew osservati b’mod korrett. Biex tikseb veloċitajiet ogħla għal xogħol sensittiv għall-ħin, noffru proċessar prijoritarju fl-API u modalità mgħaġġla f’Codex.

4. Mudelli mingħajr tokens tal-output, latenzi jew kostijiet irrappurtati jintwerew bħala linji orizzontali bit-tikek.

Awtur

OpenAI