25. mart 2026.

Predstavljamo OpenAI program nagrađivanja za prijavu sigurnosnih propusta

Testiranje sigurnosnih i problema zloupotrebe širom OpenAI-ja

Danas OpenAI pokreće javni program nagrada za sigurnosne greške⁠(otvara se u novom prozoru) usmjeren na identificiranje zloupotrebe AI-ja i sigurnosnih rizika u svim našim proizvodima. Kako se tehnologija umjetne inteligencije ubrzano razvija, tako se razvijaju i potencijalni načini na koje se može zloupotrijebiti. Naš cilj je osigurati da naši sistemi ostanu sigurni i zaštićeni od nepravilne upotrebe ili zloupotrebe koja bi mogla dovesti do stvarne štete.

Ovaj novi program će dopuniti OpenAI-jev Program nagrađivanja za prijavu sigurnosnih propusta⁠(otvara se u novom prozoru) prihvatanjem problema koji predstavljaju značajne rizike od zloupotrebe i po sigurnost, čak i ako ne ispunjavaju kriterije za sigurnosnu ranjivost. Kroz ovaj program, radujemo se nastavku partnerstva sa istraživačima u oblasti sigurnosti i bezbjednosti kako bi nam pomogli da identificiramo i riješimo probleme koji ne spadaju u konvencionalne sigurnosne ranjivosti, ali i dalje predstavljaju stvarne rizike. Prijave će razvrstati OpenAI-jevi timovi za nagrađivanje grešaka za sigurnost i bezbjednost, a mogu biti preusmjerene između ta dva programa ovisno o opsegu i nadležnosti.

Pregled programa

Novi program Safety Bug Bounty⁠(otvara se u novom prozoru) fokusira se na sigurnosne scenarije specifične za AI navedene u nastavku:

Rizici povezani s agentima, uključujući MCP

Ubrizgavanje upita i eksfiltracija podataka od strane treće strane: kada tekst napadača može pouzdano preuzeti kontrolu nad agentom žrtve (uključujući Browser, ChatGPT Agent i slične agentske proizvode) kako bi ga naveo da izvrši štetnu radnju ili otkrije osjetljive informacije korisnika. Ponašanje mora biti reproducibilno u najmanje 50% slučajeva.
OpenAI proizvod s agentičkim svojstvima izvršava zabranjenu radnju na OpenAI-jevoj web stranici u velikom obimu.
Neki OpenAI proizvod s agentičkim svojstvima izvršava potencijalno štetnu radnju koja nije navedena iznad. Valjani izvještaji ovdje trebaju ukazivati na vjerovatnu i materijalnu štetu.
Svako testiranje rizika MCP-a mora biti u skladu s uvjetima korištenja bilo kojih trećih strana.

OpenAI vlasničke informacije

Generisanja modela koja vraćaju vlasničke informacije povezane s rezonovanjem.
Ranjivosti koje otkrivaju druge vlasničke informacije OpenAI-a.

Integritet računa i platforme

Ranjivosti u integritetu računa i signalima integriteta platforme, poput zaobilaženja kontrola protiv automatizacije, manipulacije signalima povjerenja računa, izbjegavanja ograničenja/suspenzija/zabrana računa i sličnih problema.
Probleme koji korisnicima omogućavaju pristup funkcijama, podacima ili mogućnostima izvan odobrenih dozvola treba prijaviti programu za nagrađivanje sigurnosnih grešaka⁠(otvara se u novom prozoru).

Iako jailbreakovi nisu obuhvaćeni ovim programom, periodično provodimo privatne bug bounty kampanje usmjerene na određene vrste štete, kao što su problemi sa sadržajem povezanim s biorizikom u ChatGPT Agent⁠ i GPT‑5⁠. Pozivamo zainteresirane istraživače da se prijave na ove programe kada se pojave.

Izvan gore navedenih kategorija, ako istraživači identificiraju nedostatke koji omogućavaju direktne puteve do štete za korisnike i konkretne, zasebne korake za otklanjanje, oni se mogu razmatrati kao obuhvaćeni za nagrade od slučaja do slučaja. Opća zaobilaženja politike sadržaja bez dokazivog uticaja na sigurnost ili zloupotrebu nisu obuhvaćena ovim programom. Na primjer, “jailbreakovi” koji rezultiraju time da model koristi nepristojan jezik ili vraća informacije koje se lako mogu pronaći putem pretraživača nisu obuhvaćeni.

Kako učestvovati

Istraživači zainteresirani za učešće mogu se prijaviti putem našeg programa Safety Bug Bounty⁠(otvara se u novom prozoru). Radujemo se saradnji s istraživačima, etičkim hakerima i zajednicom za sigurnost i bezbjednost u nastojanju da izgradimo siguran AI ekosistem.

2026

Autor

OpenAI

Nastavite čitati

Prikažite sve

OpenAI and Hugging Face address security incident

Zaštita21. jul 2026.

Safety and alignment in an era of long-horizon models

Sigurnost20. jul 2026.

Why teens deserve access to safe AI

Sigurnost16. jul 2026.