18. joulukuuta 2025

Esittelyssä GPT‑5.2‑Codex

Edistynein agenttipohjainen koodausmalli ammattilaisohjelmistosuunnitteluun ja puolustavaan kyberturvallisuuteen.

Julkaisemme tänään GPT‑5.2‑Codexin, edistyneimmän agenttipohjaisen koodausmallin monimutkaiseen ja reaalimaailman ohjelmistosuunnitteluun. GPT‑5.2‑Codex on GPT‑5.2⁠-versio, joka on optimoitu agenttipohjaista koodausta varten Codexissa. Se sisältää parannuksia pitkän aikavälin työskentelyyn kontekstin tiivistämisen avulla, vahvemman suorituskyvyn takaamiseen suurissa koodimuutoksissa, kuten refaktoroinneissa ja migraatioissa, parantuneen suorituskyvyn takaamiseen Windows-ympäristöissä sekä merkittävästi vahvemmat kyberturvallisuusominaisuudet.

Kun mallimme kehittyvät edelleen älykkyyden eturintamalla, olemme huomanneet, että nämä parannukset johtavat myös kyvykkyyden lisääntymiseen erikoistuneilla aloilla, kuten kyberturvallisuudessa⁠. Esimerkiksi juuri viime viikolla tietoturvatutkija käytti GPT‑5.1‑Codex‑Maxia, ja Codex CLI:lla avulla löydettiin ja vastuullisesti paljastettiin⁠(avautuu uudessa ikkunassa) haavoittuvuus Reactissa, joka voisi johtaa lähdekoodin paljastumiseen.

GPT‑5.2‑Codexilla on vahvemmat kyberturvallisuusominaisuudet kuin missään tähän mennessä julkaisemassamme mallissa. Nämä edistysaskeleet voivat auttaa vahvistamaan kyberturvallisuutta laajassa mittakaavassa, mutta ne tuovat mukanaan myös uusia kahden käyttötarkoituksen riskejä, jotka vaativat huolellista käyttöönottoa. Vaikka GPT‑5.2‑Codex ei saavuta kyberturvallisuuskyvyn "korkeaa" tasoa valmiusviitekehyksessämme, suunnittelemme käyttöönottoamme⁠ tulevaa kyvykkyyksien kasvua silmällä pitäen.

Julkaisemme GPT‑5.2‑Codexin. tänään kaikilla Codex-ympäristöissä maksaville ChatGPT‑käyttäjille, ja työskentelemme turvallisesti mahdollistamaan GPT‑5.2‑Codexin saatavuuden API-käyttäjille tulevien viikkojen aikana. Samanaikaisesti pilotoimme kutsupohjaista luotettavaa pääsyä tuleviin ominaisuuksiin ja sallivampiin malleihin tarkastetuille ammattilaisille ja organisaatioille, jotka keskittyvät puolustukselliseen kyberturvallisuustyöhön. Uskomme, että tämä käyttöönoton lähestymistapa tasapainottaa saavutettavuuden ja turvallisuuden.

Reaalimaailman ohjelmistotekniikan rajojen laajentaminen

GPT‑5.2‑Codex perustuu GPT‑5.2:n vahvuuksiin⁠ ammatillisessa tietotyössä ja GPT‑5.1‑Codex‑Maxin⁠ edistyksellisiin agenttipohjaisiin koodaus- ja terminaalin käyttövalmiuksiin. GPT‑5.2‑Codex on nyt parempi pitkän kontekstin ymmärtämisessä, luotettavassa työkalujen käytössä, parannetussa faktuaalisuudessa ja natiivissa tiivistämisessä, mikä tekee siitä luotettavamman kumppanin pitkäkestoisille koodaustehtäville, säilyttäen samalla tunnisteiden tehokkuuden päättelyssään.

GPT‑5.2‑Codex saavuttaa huipputason suorituskyvyn SWE-Bench Pro:ssa ja Terminal-Bench 2.0:ssa, jotka on suunniteltu testaamaan agenttipohjaista suorituskykyä monenlaisissa tehtävissä realistisissa terminaaliympäristöissä. Se on myös paljon tehokkaampi ja luotettavampi agenttipohjaisessa koodauksessa alkuperäisissä Windows-ympäristöissä, hyödyntäen GPT‑5.1‑Codex‑Maxin esittelemiä ominaisuuksia.

Näiden parannusten ansiosta Codex pystyy paremmin työskentelemään suurissa tietovarastoissa pitkien istuntojen ajan säilyttäen koko kontekstin ennallaan. Se pystyy suorittamaan monimutkaisia tehtäviä, kuten suuria refaktorointeja, koodin siirtoja ja ominaisuuksien rakentamista, luotettavammin – jatkamalla iterointia menettämättä suuntaa, vaikka suunnitelmat muuttuisivat tai yritykset epäonnistuisivat.

SWE-Bench Prossa mallille annetaan koodivarasto, ja sen on luotava korjaustiedosto realistisen ohjelmistokehitystehtävän ratkaisemiseksi. Terminal-Bench 2.0 on vertailuarvo, joka testaa tekoälyagentteja todellisissa päätelaitteiden ympäristöissä. Tehtäviin kuuluu koodin kokoaminen, mallien koulutus ja palvelimien pystyttäminen.

Vahvemman visuaalisen suorituskyvyn ansiosta GPT‑5.2‑Codex pystyy tulkitsemaan paremmin kuvakaappauksia, teknisiä kaavioita, taulukoita ja koodausistuntojen aikana jaettuja käyttöliittymäpintoja.

Codex voi muuntaa suunnitteluluonnoksia nopeasti toimiviksi prototyypeiksi, joita voit siirtää tuotantoon Codexin avulla.

Suunnittelumalli

Prototyyppi luotu GPT‑5.2‑Codexilla.

Kyberrintaman edistäminen

Kun kartoitamme suorituskykyä yhdessä ydinkyberturvallisuuden arvioinnissamme ajan kuluessa, havaitsemme merkittävän nousun kyvykkyydessä, joka alkaa GPT‑5‑Codexista, jatkuu suurella harppauksella GPT‑5.1‑Codex‑Maxilla ja nyt kolmannella harppauksella GPT‑5.2‑Codexilla. Odotamme, että tulevat tekoälymallit jatkavat tällä tiellä. Valmistautuessamme suunnittelemme ja arvioimme, että jokainen uusi malli voisi saavuttaa kyberturvallisuuskyvykkyyden "korkean" tason, valmiusviitekehyksemme⁠(avautuu uudessa ikkunassa) mittausten mukaan. Vaikka GPT‑5.2‑Codex ei ole vielä saavuttanut kyberkyvykkyyden "korkeaa" tasoa, valmistaudumme tuleviin malleihin, jotka ylittävät tämän kynnyksen. Kyberkykyjen lisääntymisen vuoksi olemme lisänneet malliin ja tuotteeseen lisäsuojatoimia, jotka on esitelty järjestelmäkortissa⁠.

Ammattilaisten Capture-the-Flag (CTF) -arviointi mittaa, kuinka usein malli pystyy ratkaisemaan kehittyneitä, monivaiheisia reaalimaailman haasteita (jotka vaativat ammatillisen tason kyberturvallisuustaitoja) Linux-ympäristössä.

Reaalimaailman kybervalmiudet

Nykyaikainen yhteiskunta toimii ohjelmistojen varassa, ja sen luotettavuus riippuu vahvasta kyberturvallisuudesta—kriittisten järjestelmien pitäminen verkossa pankkitoiminnassa, terveydenhuollossa, viestinnässä ja välttämättömissä palveluissa, arkaluonteisten tietojen suojaaminen ja sen varmistaminen, että ihmiset voivat luottaa päivittäin käyttämiinsä ohjelmistoihin. Haavoittuvuuksia voi olla olemassa pitkään ennen kuin kukaan tietää niistä, ja niiden löytäminen, vahvistaminen ja korjaaminen riippuu usein insinöörien ja riippumattomien tietoturvatutkijoiden yhteisöstä oikeilla työkaluilla.

11. joulukuuta 2025 React-tiimi julkaisi kolme tietoturva-aukkoa, jotka vaikuttavat React Server Components -sovelluksiin. Merkittävän tästä paljastuksesta teki haavoittuvuuden lisäksi se, miten haavoittuvuudet löydettiin.

Andrew MacPherson, Privyn (Stripe-yhtiö) pääturvallisuusinsinööri, käytti GPT‑5.1‑Codex‑Maxia Codex CLI:n ja muiden agenttien avulla toistamaan ja tutkimaan erilaista kriittistä React-haavoittuvuutta, joka paljastettiin edellisellä viikolla ja tunnetaan nimellä React2Shell⁠(avautuu uudessa ikkunassa) (CVE-2025-55182⁠(avautuu uudessa ikkunassa)). Hänen tavoitteenaan oli arvioida, kuinka hyvin malli voisi auttaa tosielämän haavoittuvuustutkimuksessa.

Aluksi hän yritti useita zero-shot-analyysejä, pyytäen mallia tutkimaan korjaustiedoston ja tunnistamaan haavoittuvuuden, jonka se korjasi. Kun se ei tuottanut tuloksia, hän siirtyi suuremman volyymin, iteratiiviseen kehotteiden antamiseen. Kun nämä lähestymistavat eivät onnistuneet, hän ohjasi Codexin tavanomaisten puolustustyönkulkujen läpi: perusti paikallisen testiympäristön, arvioi mahdollisia hyökkäyspintoja ja käytti fuzz-testausta järjestelmän tutkimiseen vääränlaisilla Syötteillä. Kun yritit toistaa alkuperäistä React2Shell-ongelmaa, Codex paljasti odottamattomia käyttäytymismalleja, jotka vaativat syvempää tutkimusta. Yhden viikon aikana tämä prosessi johti aiemmin tuntemattomien haavoittuvuuksien löytämiseen, jotka ilmoitettiin vastuullisesti React-tiimille.

Vuokaavio nimeltä “Haavoittuvuuksien löytäminen Codexin avulla: CVE-2025-55183”, joka esittää työnkulun, joka alkaa Git-varastosta ja jossa Codex skannaa koodia haavoittuvuuksien varalta. Zero-shot-yritys epäonnistuu, minkä jälkeen asiantuntijan ohjaama prosessi tutkii koodikantaa, tunnistaa mahdolliset kohteet, rakentaa testikehyksen ja suorittaa fuzz-testausta esimerkkisovellusta vastaan uudelleenvalidoimalla. Tulokset vahvistetaan konseptin todentamiseksi, mikä johtaa vastuulliseen julkistamiseen ja korjaukseen, joka lisätään takaisin varastoon.

Tämä osoittaa, kuinka kehittyneet tekoälyjärjestelmät voivat nopeuttaa puolustavaa tietoturvatyötä merkittävästi laajalti käytetyissä, todellisissa ohjelmistoissa. Samalla puolustajien nopeampaan toimintaan auttavat ominaisuudet voivat myös joutua pahantahtoisten toimijoiden väärinkäytön kohteeksi.

Agenttipohjaisten järjestelmien kehittyessä yhä kyvykkäämmiksi kyberturvallisuuteen liittyvissä tehtävissä, asetamme keskeiseksi tavoitteeksemme varmistaa, että näitä edistysaskeleita otetaan käyttöön vastuullisesti—ja että jokaista kyvykkyyden lisäystä täydennetään vahvemmilla suojatoimilla, tiukemmilla pääsynvalvontatoimenpiteillä ja jatkuvalla yhteistyöllä turvallisuusyhteisön kanssa.

Kyberturvallisuuden vahvistaminen luotettavan käytön avulla

Tietoturvatiimit voivat kohdata rajoituksia yrittäessään jäljitellä uhkatoimijoita, analysoida haittaohjelmia korjaamisen tukemiseksi tai testata kriittistä infrastruktuuria. Kehitämme luotettavaa käyttöoikeuspilottia poistaaksemme kitkan kelpoisuusehdot täyttäviltä käyttäjiltä ja annamme luotettaville puolustajille mahdollisuuden käyttää uusinta tekoälypohjaista kyberkyvykkyyttä kyberpuolustuksen tehostamiseksi.

Aluksi pilottiohjelma on vain kutsutuille tietoturva-ammattilaisille, joilla on näyttöä vastuullisesta haavoittuvuuksien ilmoittamisesta, ja organisaatioille, joilla on selkeä ammatillinen kyberturvallisuuskäyttötarkoitus. Kelpoiset osallistujat saavat pääsyn tehokkaimpiin malleihimme puolustustarkoituksiin, jotta laillinen kaksoiskäyttö on mahdollista.

Jos olet tietoturva-ammattilainen tai osa organisaatiota, joka tekee eettistä tietoturvatyötä, kuten haavoittuvuustutkimusta tai valtuutettua red-teamingia, kutsumme sinut ilmaisemaan kiinnostuksesi liittyä ja jakamaan palautetta siitä, mitä haluaisit ohjelmalta täällä⁠(avautuu uudessa ikkunassa).

Johtopäätös

GPT‑5.2‑Codex edustaa edistysaskelta siinä, miten kehittynyt tekoäly voi tarjota tukea tosielämän ohjelmistosuunnittelulle ja erikoistuneille toimialueille, kuten kyberturvallisuudelle – auttaen kehittäjiä ja puolustajia selviytymään monimutkaisista, pitkän aikavälin tehtävistä ja vahvistamaan vastuullisen tietoturvatutkimuksen työkaluja.

Ottamalla käyttöön GPT‑5.2‑Codexin asteittain, yhdistämällä käyttöönotto suojatoimiin ja tekemällä tiivistä yhteistyötä tietoturvayhteisön kanssa pyrimme maksimoimaan puolustusvaikutuksen samalla kun vähennämme väärinkäytön riskiä. Tästä julkaisusta saadut opit vaikuttavat suoraan siihen, miten laajennamme pääsyä ajan myötä, kun ohjelmistojen ja kyberrintaman rajat jatkavat kehittymistä.

Tekijä

OpenAI

Jatka lukemista

Näytä kaikki

oai Science Academic Research Academic Research 1x1

Tieteellisiä löytöjä vauhdittava ChatGPT akateemisille tutkijoille

Yritys29.7.2026

Miten GPT-5.6 yhdistää edistyneen älykkyyden ja tehokkuuden

Tekniikka29.7.2026

How AI is expanding what we do at work > Cover image

Kuinka tekoäly laajentaa ihmisten työnkuvaa

Yritys27.7.2026