Oktoobar 29, 2025

Soo bandhigida gpt-oss-safeguard

Noocyo cusub oo open safety reasoning ah (120b iyo 20b) oo taageera siyaasado amni oo gaar loo habeeyey.

Soo kacaya…

Maanta, waxaan sii deynaynaa horudhac cilmi-baariseed oo ah gpt-oss-safeguard, oo ah noocyadeenna open-weight reasoning ee hawlaha kala soocidda amniga, kuna jira laba cabbir: gpt-oss-safeguard-120b iyo gpt-oss-safeguard-20b. Noocyadani waa noocyo la sii turxaan bixiyay oo ka mid ah gpt-oss⁠ open model-yadeenna, waxaana lagu heli karaa isla rukhsadda dabacsan ee Apache 2.0, taas oo qof kasta u oggolaanaysa inuu si xor ah u isticmaalo, u beddelo, uguna hawlgeliyo. Labada noocba maanta waa lagala soo degi karaa Hugging Face⁠(ku furmaa daaqad cusub).

Noocyada gpt-oss-safeguard waxay adeegsadaan caqliyeynta si ay si toos ah ugu fasiraan siyaasad uu horumariyuhu bixiyo waqtiga inference-ka—iyagoo kala saaraya farriimaha isticmaalaha, completions, iyo wada sheekaysiyo buuxa sida uu horumariyuhu u baahan yahay. Horumariyaha ayaa mar walba go’aamiya siyaasadda la adeegsanayo, sidaas darteed jawaabuhu way ka sii habboon yihiin oo loogu habeeyey isticmaalka horumariyaha. Noocku wuxuu adeegsadaa silsilada fikirka, taas oo horumariyuhu dib u eegi karo si uu u fahmo sida noocku go’aannadiisa ku gaarayo. Intaa waxaa dheer, siyaasadda waxaa la bixiyaa inta inference-ku socdo, halkii lagu tababari lahaa nooca, sidaas darteed way u sahlan tahay horumariyeyaasha inay si ku-celcelis ah u saxaan siyaasadaha si waxqabadka loo kordhiyo. Habkan, oo aan markii hore u samaynay isticmaal gudaha ah, aad buu uga dabacsan yahay habka dhaqameed ee lagu tababaro kala sooce si uu si dadban uga soo saaro xadka go’aanka isagoo ka duulaya tiro badan oo tusaalooyin la calaamadeeyay ah.

gpt-oss-safeguard wuxuu u suurageliyaa horumariyeyaasha inay sawiraan xariiqyada siyaasadeed ee sida ugu fiican ugu habboon isticmaalka ay leeyihiin. Tusaale ahaan, gole dood oo ciyaaraha fiidyowga ah ayaa laga yaabaa inuu rabo inuu dejiyo siyaasad lagu kala saaro qoraallada ka hadlaya khiyaanada ciyaarta, ama bog dib-u-eegisyada alaabtu wuxuu rabi karaa inuu adeegsado siyaasad u gaar ah si uu u shaandheeyo dib-u-eegisyada u muuqda kuwo been abuur ah.

Noocku wuxuu hal mar qaataa laba gelin—siyaasad iyo nuxurka lagu kala saarayo siyaasaddaas hoosteeda—wuxuuna soo saaraa gunaanad ku saabsan halka nuxurku ku dhacayo, oo ay la socoto caqliyeyntiisu. Horumariyeyaashu waxay go’aansadaan sida, haddii ay jirtoba, gunaanadyadaas loogu adeegsanayo dhuumahooda amni. Waxaan aragnay habkan ku salaysan caqliyeynta inuu si gaar ah ugu shaqeeyo si fiican xaaladaha ay:

Dhibaatada suurtagalka ahi ay soo baxeyso ama is beddeleyso, siyaasadduna u baahan tahay inay si dhaqso leh ula qabsato.
Qaybtu ay tahay mid aad u xeel dheer oo ay ku adag tahay kala soocayaasha yaryar inay maareeyaan.
Horumariyeyaashu aysan haysan muunado ku filan oo ay ku tababaraan kala sooce tayo sare leh oo khatar kasta uga gaar ah madalkooda.
Dib-u-dhacu uu ka muhiimsanayn soo saarista calaamado tayo sare leh oo la sharxi karo.

Waxaan sii deynaynaa horudhacan gpt-oss-safeguard si aan uga helno jawaab celin bulshada cilmi-baarista iyo amniga oo aan u sii horumarino waxqabadka nooca. Muddo bilo ah, waxaan la shaqaynaynay ROOST⁠(ku furmaa daaqad cusub) sii deyntan open weight-ka ah si aan u aqoonsanno baahiyaha muhiimka ah ee horumariyeyaasha, u tijaabino nooca, una soo saarno dukumeenti horumariyeyaal. Qayb ka mid ah bilaabashadan, ROOST waxay dhisaysaa bulsho nooc⁠(ku furmaa daaqad cusub), oo iyaduna maanta bilaabanaysa, si loo sahmiyo open AI models lagu ilaaliyo goobaha onlaynka ah. La socda sii deyntan, waxaan sidoo kale daabacaynaa warbixin farsamo⁠ oo kooban oo faahfaahinaysa waxqabadka amni ee noocan horudhaca ah.

Amniga heer nidaam: doorka kala soocayaasha amniga

Marka ay timaaddo amniga, waxaan aaminsanahay difaac lakabyo badan leh⁠. Waxaan tababarnaa noocyadeenna si ay si ammaan ah uga jawaabaan, waxaana hirgelinnaa lakabyo ilaalin oo dheeraad ah si loo ogaado loona xalliyo gelinnada iyo soo-saarrada suurtagalka ah ee aan amniga ahayn ee ku jira siyaasadaheenna. Kala soocayaasha amniga, kuwaas oo kala saara nuxurka ammaan ah iyo kan aan amniga ahayn ee aag khatar gaar ah, muddo dheer waxay ahaayeen lakab difaac oo aasaasi ah oo loogu talagalay noocyadeenna iyo kuwa kale ee large language models.

Kala soocayaasha amniga ee dhaqameed, sida kuwa laga heli karo Moderation API⁠(ku furmaa daaqad cusub), waxaa lagu sameeyaa iyadoo gacanta lagu soo ururiyo kumannaan tusaale oo nuxur ammaan ah iyo mid aan amniga ahayn, laguna saleeyo siyaasado amni oo horay loo qeexay. Xogtan tababarka ah ayuu kala soocuhu ka bartaa sida loo kala garto soo-saarrada ammaan ah iyo kuwa aan amniga ahayn. Habkan dhaqameed, kala soocuhu weligiis si toos ah uma arko siyaasadda amniga. Taa beddelkeeda, wuxuu isku dayaa inuu ka soo saaro siyaasadda hoose ee loo adeegsaday calaamadaynta tusaalooyinka isagoo raadinaya isu ekaanshaha nuxurka lagu calaamadeeyay inaanu amni ahayn iyo farqiga u dhexeeya nuxurka aan amniga ahayn iyo kan ammaan ah.

Kala soocayaasha dhaqameed waxay yeelan karaan waxqabad sare, dib-u-dhac hoose, iyo kharash hawlgal oo yar. Laakiin ururinta tiro ku filan oo tusaalooyin tababar ah waxay noqon kartaa mid waqti badan qaadata oo qaali ah, cusboonaysiinta ama beddelidda siyaasaduna waxay u baahan tahay in dib loo tababaro kala soocaha.

gpt-oss-safeguard wuu ka duwan yahay sababtoo ah awoodihiisa caqliyeyneed waxay u oggolaanayaan horumariyeyaasha inay adeegsadaan siyaasad kasta , oo ay ku jiraan kuwa ay iyagu qoraan ama ka keenaan ilo kale, caqliyeyntuna waxay ka caawisaa noocyada inay guudmar ku sameeyaan siyaasado cusub oo la qoray. Marka laga tago siyaasadaha amniga, gpt-oss-safeguard waxaa loo adeegsan karaa in nuxurka siyaabo kale loogu calaamadeeyo oo muhiim u ah badeecooyin iyo madallo gaar ah.

Jaantus socod ah oo cinwaankiisu yahay ‘caqliyeyn ku salaysan siyaasad oo leh gpt-oss-safeguard.’ Siyaasadaha uu bixiyo horumariyaha iyo waxyaabaha uu bixiyo isticmaalahu waxay galaan GPT-OSS-Safeguard. Noocku wuxuu soo saaraa silsilada fikirka ka dibna go’aan siyaasadeed, iyadoo wareeg lagu calaamadeeyay ‘ku-celcelinta siyaasadda’ uu dib ugu noqdo si loo sii habeeyo siyaasadaha. Sharaxaaddu waxay muujinaysaa gelinta horumariyaha, gelinta isticmaalaha, iyo soo-saarka nooca.

Sida aan gudaha ugu adeegsanno safety reasoning

Noocyadeenna reasoning-ka ee aasaasiga ah hadda si toos ah ayay u bartaan siyaasadaheenna amniga, waxayna adeegsadaan awoodahooda caqliyeyneed si ay uga fikiraan waxa ammaan ah. Habkan, oo aan ugu yeerno U hoggaansanaanta u fiirsashada⁠, wuxuu si weyn uga fiican yahay hababkii hore ee tababarka amniga wuxuuna ka dhigaa noocyadeenna reasoning-ka kuwo ka ammaan badan kuwii ka horreeyay ee aan reasoning-ka ahayn dhowr jiho, xitaa iyadoo awooddoodu sii kordhayso. Laakiin caqliyeyntu faa’iido kuma laha oo keliya tababarka noocyada laftooda. Waxay sidoo kale abuureysaa fursado cusub oo loogu talagalay difaac lakabyo badan leh. Hababka ku salaysan caqliyeyntu way ka dabacsan yihiin oo si yar ayaa loogu xaddidaa faahfaahinta tababarkoodii hore, faa’iidooyin mararka qaarkood ka miisaan culus kharashka xisaabinta dheeraadka ah iyo dib-u-dhaca ay keenaan.

gpt-oss-safeguard waa hirgelin open-weight ah oo hab aan gudaha ku samaynay, oo ku jira aalad aan ugu yeerno Safety Reasoner. Waxaan ku billownay turxaan bixinta xoojinta ee hawlaha calaamadaynta siyaasadda, annagoo abaalmarinayna nooca marka uu ka tarjumayo xukunnada saxda ah ee khubarada aadanaha. Tani waxay bartay nooca inuu ka fikiro sida siyaasadda ay ugu horseeddo xukunkiisa. Maanta, Safety Reasoner wuxuu noo suurtageliyaa inaan si firfircoon u cusboonaysiinno siyaasadaheenna amniga ee production-ka waqti ka yar kan lagu dib-u-tababari lahaa kala sooce. Tani waxay ka dhigaysaa Safety Reasoner aalad muhiim u ah hawlgelin ku-celcelis ah⁠: marka aan noocyo cusub geyno production-ka, badanaa waxaan ku bilaabnaa siyaasado adag oo dheeraad ah oo aan isticmaalnaa xaddi xisaabin oo aad u badan halka loo baahdo si Safety Reasoner uu si taxaddar leh ugu dabaqo siyaasadahaas. Kadib waxaan hagaajinnaa siyaasadaheenna marka fahamkeenna khataraha production-ku uu soo hagaago. Qaar ka mid ah bilaabitaannadeennii u dambeeyay, saamiga guud ee xisaabinta loogu qoondeeyay safety reasoning wuxuu gaaray ilaa 16%.

Safety Reasoner wuxuu noqday qayb aasaasi ah oo ka mid ah safety stack-keenna. Soo saarida sawirka iyo Sora 2, wuxuu ku sameeyaa qiimeyn firfircoon oo tallaabo-tallaabo ah soo-saarrada si loo aqoonsado loona xannibo wax-soo-saar aan amni ahayn waqtiga dhabta ah. Qaybo ay ka mid yihiin bayoolaji iyo is-dhaawacid, waxaan ku socodsiinnaa noocyo sida kuwa loo adeegsado Moderation API oo ah kala soocayaal yaryar, degdeg ah, oo dib-u-helis sare leh si loo go’aamiyo nuxurka ku jira qayb xiiso leh, ka dibna waxaan u adeegsannaa Safety Reasoner inuu dib u eego nuxurkaas. Safety Reasoner wuxuu u kala saaraa soo-saarrada nooca iyadoo lala barbardhigayo taxanayn faahfaahsan si loo go’aamiyo sida ugu habboon ee looga jawaabi karo, taasoo ka dhigaysa qayb ka mid ah ilaalooyinkeenna lakabyada badan leh ee nidaamyada sida GPT‑5 iyo ChatGPT Agent. Haddana, noocyada gpt-oss-safeguard waxay habkan la midka ah u diyaarinayaan qof kasta.

Sida gpt-oss-safeguard u shaqeeyo

Waxaan ku qiimeynay noocyada gpt-oss-safeguard labadaba xirmooyin qiimeyn gudaha ah iyo kuwo dibadda ah.

Qiimeynta gudaha, waxaan siinnay gpt-oss-safeguard siyaasado badan hal mar inta inference-ku socdo. Gelin kasta oo tijaabo ah, waxaan qiimeynaa in gpt-oss-safeguard si sax ah u kala saaro qoraalka iyadoo la raacayo dhammaan siyaasadaha ku jira. Tani waa hawl adag—noocka waxaa loo tiriyaa sax oo keliya haddii uu si buuxda ula jaanqaado calaamadaha golden set-ka ee dhammaan siyaasadaha ku jira.

Noocyadeenna gpt-oss-safeguard iyo Safety Reasoner-keenna gudaha waxay ka waxqabad fiican yihiin gpt-5-thinking iyo gpt-oss open models marka la eego saxnaanta siyaasado badan. In noocyada gpt-oss-safeguard ay ka fiican yihiin gpt-5-thinking gaar ahaan waa wax lala yaabo marka la eego cabbirka yar ee noocyada hore.

Waxaan sidoo kale ku sii qiimeynay noocyadan xogta moderation-ka⁠(ku furmaa daaqad cusub) ee aan la sii deynay waraaqdayadii cilmi-baarista ee 2022⁠(ku furmaa daaqad cusub) iyo ToxicChat⁠(ku furmaa daaqad cusub), oo ah benchmark dadweyne oo ku salaysan su’aalaha isticmaalayaasha ee chatbot open-source ah.

Xirmada qiimeynta moderation-ka ee 2022, waxaan ku qiimeynay annagoo adeegsanayna siyaasadaheenna amniga ee gudaha ah (annagoo hal siyaasad la waafajinayna isbeddelladii xigay). gpt-oss-safeguard wax yar buu ka fiicnaaday dhammaan noocyadii kale ee la tijaabiyay, oo ay ku jiraan Safety Reasoner-keenna gudaha iyo gpt-5-thinking, inkastoo farqigan u dhexeeya Safety Reasoner iyo gpt-oss-safeguard aanu tirakoob ahaan muhiim ahayn.

Dhanka ToxicChat, waxaan ku qiimeynay annagoo adeegsanayna weydiin gaaban oo gacanta lagu qoray oo laga waafajiyay qaar ka mid ah siyaasadaheenna gudaha. Safety Reasoner-keenna gudaha ayaa mar kale ka fiicnaaday gpt-5-thinking, halka gpt-5-thinking iyo Safety Reasoner labaduba wax yar uga fiican yihiin gpt-oss-safeguard-120b iyo gpt-oss-safeguard-20b. Waxaan filaynaa in cabbirka yar ee gpt-oss-safeguard uu wali ka dhigayo mid la doorbido hawsha noocan ah.

Xaddidaadaha

Waxaa jira laba xaddidaad oo gaar ah oo ku saabsan gpt-oss-safeguard. Marka hore, waxaan aragnay in kala soocayaal lagu tababaray tobannaan kun oo muunado tayo sare leh oo la calaamadeeyay ay wali ka shaqayn karaan si ka fiican gpt-oss-safeguard marka loo eego kala saarista nuxurka isagoo si toos ah uga caqliyeynaya siyaasadda. Qaadashada waqti lagu tababaro kala sooce u go’an ayaa laga yaabaa in loo doorbido waxqabad sare oo khataraha adag ah.

Marka labaad, gpt-oss-safeguard wuxuu u baahan karaa waqti iyo xisaabin badan, taas oo ka dhigaysa mid adag in lagu miisaamo dhammaan nuxurka madasha. Gudaha, waxaan tan dhowr siyaabood ugu maareynaa annagoo adeegsanayna Safety Reasoner: (1) waxaan adeegsannaa kala soocayaal yaryar oo dheereeya si aan u go’aamino nuxurka la qiimeynayo iyo (2) xaalado qaarkood, waxaan u adeegsannaa Safety Reasoner si asynchronous ah si aan u bixinno waayo-aragnimo isticmaal oo dib-u-dhac yar leh annagoo ilaalinayna awoodda aan ku faragelin karno haddii aan ogaanno nuxur aan amni ahayn.

Waddada horteenna taal: sii wadidda dhismaha bulshada

gpt-oss-safeguard waa xirmadii ugu horreysay ee OpenAI ee open safety models oo lala dhisay bulshada. Waxaan ku celcelinnay gpt-oss-safeguard annagoo la shaqaynayna khubaro trust and safety ah oo ka socda SafetyKit, ROOST, Tomoro, iyo Discord qayb ka ah tijaabadii hore. CTO-ga ROOST Vinay Rao wuxuu yiri, “gpt-oss-safeguard waa reasoning model-kii ugu horreeyay ee open source ah oo leh naqshad ‘la imow siyaasadahaaga iyo qeexitaannadaada dhibaatada’. Ururradu waxay mudan yihiin inay si xor ah u daraaseeyaan, u beddelaan una adeegsadaan teknoolojiyadaha amniga ee muhiimka ah ayna awood u yeeshaan hal-abuur. Tijaabooyinkeenna, wuxuu xirfad u lahaa fahamka siyaasado kala duwan, sharxidda caqliyeyntiisa, iyo muujinta xeelad marka siyaasadaha la dabaqayo, taas oo aan aaminsanahay inay faa’iido u yeelan doonto builders-ka iyo kooxaha amniga.”

Waxaan sii wadi doonnaa ku-celcelinta bulshada si aan u horumarinno qalabka open safety, oo ay ku jirto iyada oo loo marayo ROOST Model Community (RMC). RMC waxay isu keentaa xirfadlayaal iyo cilmi-baarayaal amni si ay u wadaagaan hababka ugu fiican ee lagu gelinayo open source AI models qulqulka shaqada amniga, oo ay ku jiraan natiijooyinka qiimeynta iyo jawaab celinta nooca. Booqo RMC GitHub repo⁠(ku furmaa daaqad cusub) si aad wax badan uga barato iskaashigan iyo sida looga qayb qaato.

Si aad u bilowdo dhisidda noocyadan, kala soo deg Hugging Face⁠(ku furmaa daaqad cusub).

2025

Qoraa

OpenAI

Sii wad akhrinta

Eeg dhamaan

warbixinta farsamo ee gpt-oss-safeguard

BadqabkaOkt 29, 2025

Soo bandhigista gpt-oss

ShaacinOgs 5, 2025

Kaadhka nooca gpt-oss-120b & gpt-oss-20b

DaabacaaddaOgs 5, 2025