Vi lanserar gpt-oss-120b och gpt-oss-20b – två open-weight reasoning-modeller som finns tillgängliga under Apache 2.0-licensen och vår gpt-oss-användningspolicy. Utvecklade med feedback från open-source-communityn är dessa text-endast-modeller kompatibla med vårt Responses API och avsedda att användas i agentiska arbetsflöden som kräver stark instruktionsefterlevnad, verktygsanvändning såsom webbsökning och körning av Python-kod samt resonemangsförmåga — inklusive möjligheten att justera resonemangsnivån för uppgifter som inte kräver komplexa resonemang. Modellerna är anpassningsbara, erbjuder full Chain‑of‑Thought (CoT) och stödjer strukturerade utdata.
Säkerhet är en hörnsten i våra öppna modeller De har en annan riskprofil än proprietära modeller: När de väl har släppts kan målmedvetna angripare finjustera dem för att kringgå säkerhetsavslag eller direkt optimera dem för skada, utan att OpenAI kan införa ytterligare åtgärder eller återkalla åtkomsten.
I vissa sammanhang behöver utvecklare och företag införa extra skyddsåtgärder för att replikera de systemnivåskydd som är inbyggda i modeller som tillhandahålls via vårt API och våra produkter. Vi kallar det här dokumentet ett model card, snarare än ett system card, eftersom gpt-oss-modellerna kommer att användas i ett brett spektrum av system som skapas och underhålls av många olika intressenter. Även om modellerna som standard är utformade för att följa OpenAIs säkerhetspolicyer, kommer andra intressenter också att fatta och genomföra egna beslut om hur systemen ska hållas säkra.
Vi genomförde skalbara kapacitetsutvärderingar av gpt-oss-120b och bekräftade att standardmodellen inte når våra indikativa trösklar för High capability i någon av de tre spårade kategorierna i vårt Preparedness Framework (Biological and Chemical capability, Cyber capability och AI Self-Improvement). Vi undersökte också två ytterligare frågor:
- Skulle illvilliga aktörer kunna finjustera gpt-oss-120b för att uppnå High capability inom domänerna Biological and Chemical eller Cyber? Genom att simulera en angripares potentiella handlingar finjusterade vi gpt‑oss‑120b adversariellt för dessa två kategorier. OpenAIs Safety Advisory Group (”SAG”) granskade denna testning och drog slutsatsen att gpt-oss-120b, även efter robust finjustering som utnyttjade OpenAIs marknadsledande training stack, inte nådde High capability inom Biological and Chemical Risk eller Cyber risk.
- Skulle publiceringen av gpt‑oss‑120b avsevärt flytta fram fronten för biologiska kapaciteter i öppna foundation‑modeller? Vi fann att svaret är nej: För de flesta utvärderingar ligger standardprestandan för en eller flera befintliga öppna modeller nära den adversarialt fine-tunade prestandan hos gpt-oss-120b.
Som en del av denna lansering bekräftar OpenAI på nytt sitt åtagande att driva på utvecklingen av fördelaktig AI och höja säkerhetsstandarderna i hela ekosystemet.


