5. august 2025

gpt‑oss‑120b & gpt‑oss‑20b Modellkort

Innledning

Vi introduserer gpt-oss-120b og gpt-oss-20b – to open-weight reasoning-modeller tilgjengelige under Apache 2.0-lisensen og våre gpt-oss-retningslinjer for bruk. Utviklet med tilbakemeldinger fra open-source-miljøet er disse tekst-only-modellene kompatible med vår Responses API og designet for bruk i agentiske arbeidsflyter med sterk instruksjonsetterlevelse, verktøybruk som nettsøk og kjøring av Python-kode, samt resonneringsevner – inkludert muligheten til å justere resonneringsinnsatsen for oppgaver som ikke krever kompleks resonnering. Modellene er tilpassbare, tilbyr full Chain‑of‑Thought (CoT) og støtter strukturerte utdata.

Sikkerhet er grunnleggende for tilnærmelsen vår til open model-er. De har en annen risikoprofil enn proprietære modeller: Når de først er sluppet ut, kan målrettede angripere finjustere dem for å omgå sikkerhetsavslag eller direkte optimalisere dem for skade, uten at OpenAI kan iverksette ytterligere tiltak eller tilbakekalle tilgangen.

I enkelte sammenhenger må utviklere og virksomheter innføre ekstra sikkerhetstiltak for å reprodusere de systemnivå-beskyttelsene som er bygget inn i modellene som leveres via vår API og våre produkter. Vi kaller dette dokumentet et modellkort i stedet for et systemkort, fordi gpt-oss-modellene vil brukes som del av et bredt spekter av systemer som skapes og vedlikeholdes av mange ulike interessenter. Selv om modellene som standard er utviklet for å følge OpenAIs sikkerhetspolicyer, vil andre interessenter også fatte og gjennomføre sine egne beslutninger om hvordan systemene skal holdes trygge.

Vi gjennomførte skalerbare kapabilitetsevalueringer av gpt-oss-120b og bekreftet at standardmodellen ikke når våre veiledende terskler for High capability i noen av de tre sporede kategoriene i vårt Preparedness Framework (Biological and Chemical capability, Cyber capability og AI Self-Improvement). Vi undersøkte også to ekstra spørsmål:

Kan ondsinnede aktører finjustere gpt-oss-120b slik at den oppnår High capability innen områdene Biological and Chemical eller Cyber? Ved å simulere potensielle handlinger fra en angriper finjusterte vi gpt‑oss‑120b adversarialt for disse to kategoriene. OpenAIs Safety Advisory Group («SAG») gjennomgikk denne testingen og konkluderte med at selv med robust finjustering som benyttet OpenAIs ledende training stack, nådde gpt-oss-120b ikke High capability innen Biological and Chemical Risk eller Cyber risk.
Vil utgivelsen av gpt‑oss‑120b vesentlig flytte fronten for biologiske kapabiliteter i åpne foundation‑modeller? Vi fant at svaret er nei: I de fleste evalueringer kommer standardytelsen til én eller flere eksisterende åpne modeller nesten opp på nivå med ytelsen til gpt-oss-120b etter adversarial fin-tuning.

Som en del av denne lanseringen bekrefter OpenAI på nytt sitt engasjement for å fremme fordelaktig KI og heve sikkerhetsstandardene i hele økosystemet.

Forfatter

OpenAI

Les videre

Se alle

Safety and alignment in an era of long-horizon models

Sikkerhet20. juli 2026

Why teens deserve access to safe AI — card image

Hvorfor tenåringer fortjener tilgang til trygg KI

Sikkerhet16. juli 2026

GPT-Red: Låser opp selvforbedring for robusthet

Sikkerhet15. juli 2026