Картица модела за gpt-oss-120b и gpt-oss-20b
Представљамо gpt-oss-120b и gpt-oss-20b, два модела резоновања са отвореним тежинама доступна под лиценцом Apache 2.0 и нашом политиком коришћења gpt-oss. Развијени уз повратне информације заједнице отвореног кода, ови модели само за текст компатибилни су са нашим Responses API-јем и осмишљени су за употребу у оквиру агентских токова рада, уз поуздано праћење упутстава, коришћење алата као што су веб претрага и извршавање Python кода, као и способности резоновања — укључујући могућност прилагођавања нивоа уложеног резоновања за задатке који не захтевају сложено резоновање. Модели се могу прилагођавати, пружају пун начин резоновања (CoT) и подржавају структуриране излазе.
Безбедност је темељ нашег приступа отвореним моделима. Они представљају другачији профил ризика од власничких модела: када се једном објаве, одлучни нападачи могли би да их фино подесе како би заобишли безбедносна одбијања или директно их оптимизовали за наношење штете, без могућности да OpenAI примени додатна ублажавања или да опозове приступ.
У неким контекстима, програмери и предузећа ће морати да примене додатне заштитне мере како би реплицирали заштите на нивоу система уграђене у моделе који се испоручују преко нашег API-ја и производа. Овај документ називамо картицом модела, а не системском картицом, зато што ће се gpt-oss модели користити као део широког спектра система које ствара и одржава широк спектар заинтересованих страна. Иако су модели подразумевано осмишљени да прате OpenAI безбедносне политике, и друге заинтересоване стране ће доносити и спроводити сопствене одлуке о томе како да те системе одрже безбедним.
Спровели смо скалабилне процене способности на gpt-oss-120b и потврдили да подразумевани модел не достиже наше индикативне прагове за високу способност ни у једној од три праћене категорије нашег Оквира спремности (биолошке и хемијске способности, сајбер способности и самопобољшавање AI-ја). Такође смо истражили још два додатна питања:
- Да ли би противнички актери могли фино да подесе gpt-oss-120b тако да достигне високу способност у биолошким и хемијским или сајбер доменима? Симулирајући потенцијалне поступке нападача, противнички смо фино подесили модел gpt-oss-120b за ове две категорије. OpenAI Safety Advisory Group („SAG“) прегледала је ово тестирање и закључила да gpt-oss-120b, чак и уз робусно фино подешавање које је користило водећи OpenAI стек за обучавање у овој области, није достигао високу способност у биолошком и хемијском ризику нити у сајбер ризику.
- Да ли би објављивање gpt-oss-120b значајно унапредило гранични ниво биолошких способности код отворених основних модела? Утврдили смо да је одговор не: у већини евалуација, подразумеване перформансе једног или више постојећих отворених модела приближавају се перформансама gpt-oss-120b након противничког финог подешавања.
Као део овог лансирања, OpenAI поново потврђује своју посвећеност унапређивању корисне вештачке интелигенције и подизању безбедносних стандарда широм екосистема.


