25. marec 2026

Predstavljamo OpenAI-jev program nagrajevanja za odkrite varnostne napake

Preizkušanje za odkrivanje težav z varnostjo in zlorabami v celotni družbi OpenAI

Družba OpenAI danes začenja javni program nagrajevanja za odkrite varnostne napake⁠(odpre se v novem oknu), ki se osredotoča na prepoznavanje zlorab umetne inteligence in varnostnih tveganj v vseh naših produktih. S hitrim razvojem tehnologije umetne inteligence se povečujejo tudi možni načini njene zlorabe. Naš cilj je zagotoviti, da naši sistemi ostanejo varni in zaščiteni pred napačno uporabo ali zlorabo, ki bi lahko povzročila oprijemljivo škodo.

Ta novi program bo dopolnjeval OpenAI-jev program nagrajevanja za odkrite varnostne ranljivosti⁠(odpre se v novem oknu), saj bo sprejemal težave, ki predstavljajo pomembna tveganja zlorabe in varnostna tveganja, tudi če ne izpolnjujejo meril za varnostno ranljivost. V sklopu tega programa se veselimo nadaljnjega sodelovanja z raziskovalci na področju varnosti in zaščite, ki nam pomagajo prepoznati in obravnavati težave, ki ne sodijo med običajne varnostne ranljivosti, vendar še vedno predstavljajo pomembna tveganja. Prijave bodo pregledale in razvrstile OpenAI-jeve ekipe za program nagrajevanja za odkrite varnostne napake in pomanjkljivosti, ki po potrebi glede na obseg in pristojnost lahko prehajajo med obema programoma.

Pregled programa

Novi program nagrajevanja za odkrite varnostne napake⁠(odpre se v novem oknu) se osredotoča na spodaj navedene varnostne scenarije, specifične za umetno inteligenco:

Agentska tveganja, vključno s protokolom MCP

Vstavljanje zavajajočega poziva s strani tretje osebe in eksfiltracija podatkov: ko besedilo napadalca lahko zanesljivo ugrabi agenta žrtve (vključno z agentom Browser, ChatGPT Agent in podobnimi agentskimi produkti) ter ga pretenta, da izvede škodljivo dejanje ali razkrije občutljive podatke uporabnika. Takšno vedenje mora biti mogoče poustvariti vsaj v 50 % primerov.
OpenAI-jev agentski produkt izvede nedovoljeno dejanje na spletnem mestu družbe OpenAI v velikem obsegu.
OpenAI-jev agentski produkt izvede potencialno škodljivo dejanje, ki ni navedeno zgoraj. Veljavna poročila morajo v tem primeru navesti verjetno in znatno škodo.
Vsako preizkušanje za tveganje po protokolu MCP mora biti v skladu s pogoji storitev zunanjih ponudnikov.

Lastniške informacije družbe OpenAI

Generacije modelov, ki vračajo lastniške informacije, povezane s sklepanjem.
Ranljivosti, ki razkrivajo druge lastniške informacije družbe OpenAI.

Neokrnjenost računa in platforme

Ranljivosti v signalih neokrnjenosti računa in platforme, kot so obidenje nadzornih mehanizmov proti avtomatizaciji, manipulacija signalov zaupanja računa, izogibanje omejitvam, začasnim onemogočitvam in trajnim prepovedim računa ter podobne težave.
Težave, ki uporabnikom omogočajo dostop do funkcij, podatkov ali zmogljivosti, ki presegajo njihova odobrena dovoljenja, je treba prijaviti v sklopu programa nagrajevanja za odkrite varnostne ranljivosti⁠(odpre se v novem oknu).

Čeprav »jailbreaki« niso del tega programa, občasno izvajamo zasebne kampanje nagrajevanja za odkrite programske napake, osredotočene na določene vrste škode, kot so vsebinske težave, povezane z biološkimi tveganji, v agentu ChatGPT Agent⁠ in modelu GPT‑5⁠. Zainteresirane raziskovalce vabimo, da se prijavijo v te programe, ko bodo na voljo.

Onkraj zgoraj navedenih kategorij se lahko ugotovitve raziskovalcev, če prepoznajo pomanjkljivosti, ki neposredno vodijo do škode za uporabnike, ter izvedljive, jasno opredeljene korake za odpravo, štejejo za upravičene do nagrade, kar se obravnava od primera do primera. Splošni obvodi pravilnikov o vsebini brez dokazljivega vpliva na varnost ali zlorabo ne spadajo v sklop tega programa. Na primer »jailbreaki«, zaradi katerih model uporablja nesramen jezik ali vrača informacije, ki jih je mogoče zlahka najti z iskalniki, ne spadajo v sklop tega programa.

Kako sodelovati

Raziskovalci, ki jih zanima sodelovanje, se lahko prijavijo prek našega programa nagrajevanja za odkrite programske napake⁠(odpre se v novem oknu). Veselimo se sodelovanja z raziskovalci, etičnimi hekerji in skupnostjo strokovnjakov za varnost in zaščito pri prizadevanjih za varen ekosistem umetne inteligence.

2026

Avtor

OpenAI

Berite naprej

Prikaži vse

OpenAI in Hugging Face obravnavata varnostni incident

Sistemska zaščita21. jul. 2026

Safety and alignment in an era of long-horizon models

Varnost20. jul. 2026

Why teens deserve access to safe AI — card image

Zakaj si najstniki zaslužijo dostop do varne umetne inteligence

Varnost16. jul. 2026