Vi introducerer gpt-oss-120b og gpt-oss-20b – to open-weight reasoning-modeller tilgængelige under Apache 2.0-licensen og vores gpt-oss-brugspolitik. Udviklet med feedback fra open source-fællesskabet er disse tekst-kun-modeller kompatible med vores Responses API og designet til at blive brugt i agentiske workflows med stærk instruktionsfølge, værktøjsbrug som websøgning og eksekvering af Python-kode samt solide ræsonneringsevner – inklusive muligheden for at justere ræsonneringsindsatsen til opgaver, der ikke kræver kompleks tænkning. Modellerne er tilpasningsvenlige, tilbyder fuld Chain‑of‑Thought (CoT) og understøtter strukturerede outputs.
Sikkerhed er grundlæggende for vores tilgang til åbne modeller. De udgør en anden risikoprofil end proprietære modeller: Når de først er frigivet, kan beslutsomme angribere finjustere dem for at omgå sikkerhedsafslag eller direkte optimere dem til skade, uden at OpenAI har mulighed for at indføre yderligere afbødninger eller tilbagekalde adgangen.
I visse sammenhænge skal udviklere og virksomheder implementere ekstra sikkerhedsforanstaltninger for at kunne gengive de systemniveau-beskyttelser, der er indbygget i modellerne, når de leveres via vores API og produkter. Vi kalder dette dokument et modelkort i stedet for et systemkort, fordi gpt-oss-modellerne vil blive brugt som en del af et bredt udvalg af systemer, der skabes og vedligeholdes af mange forskellige interessenter. Selvom modellerne som udgangspunkt er designet til at følge OpenAIs sikkerhedspolitikker, vil andre interessenter også træffe og gennemføre deres egne beslutninger om, hvordan de systemer holdes sikre.
Vi gennemførte skalerbare kapabilitetsevalueringer af gpt-oss-120b og bekræftede, at standardmodellen ikke når vores vejledende tærskler for High capability i nogen af de tre sporede kategorier i vores Preparedness Framework (Biological and Chemical capability, Cyber capability og AI Self-Improvement). Vi undersøgte også to yderligere spørgsmål:
- Kan ondsindede aktører finjustere gpt-oss-120b til at opnå High capability inden for områderne Biological and Chemical eller Cyber? Ved at simulere en angribers potentielle handlinger adversarie... fintunede vi gpt‑oss‑120b for disse to kategorier. OpenAIs Safety Advisory Group (”SAG”) gennemgik denne test og konkluderede, at selv med robust finjustering, der udnyttede OpenAIs førende training stack, nåede gpt-oss-120b ikke High capability inden for Biological and Chemical Risk eller Cyber risk.
- Vil udgivelsen af gpt‑oss‑120b væsentligt fremme grænsen for biologiske kapabiliteter i åbne foundation‑modeller? Vi fandt, at svaret er nej: I de fleste evalueringer ligger standardydelsen for én eller flere eksisterende open-modeller tæt på den ydelse, gpt-oss-120b opnår efter adversarial fine-tuning.
Som en del af denne lancering bekræfter OpenAI sit engagement i at fremme gavnlig AI og hæve sikkerhedsstandarderne i hele økosystemet.


