Bemutatjuk az OpenAI Safety Bug Bounty programot
Biztonsággal és visszaélésekkel kapcsolatos problémák tesztelése az OpenAI-nál
Az OpenAI ma elindítja a nyilvános Safety Bug Bounty(új ablakban nyílik meg) programot, amelynek célja a mesterséges intelligenciával kapcsolatos visszaélések és biztonsági kockázatok azonosítása a termékeinkben. Az AI-technológia gyors fejlődésével együtt egyre bővülnek a használatával kapcsolatos visszaélések lehetséges módjai is. Célunk, hogy megőrizzük rendszereink biztonságát a valós károkat okozni képes helytelen használattal vagy visszaélésekkel szemben.
Ez az új program kiegészíti az OpenAI Security Bug Bounty(új ablakban nyílik meg) programját azáltal, hogy olyan problémák bejelentéseit is fogadja, amelyek még akkor is jelentős visszaélési és biztonsági kockázatot jelentenek, ha nem felelnek meg a biztonsági sebezhetőség kritériumainak. A program keretében továbbra is együttműködünk a biztonsági és védelmi kutatókkal, hogy segítsenek azonosítani és kezelni azokat a problémákat, amelyek túlmutatnak a hagyományos biztonsági sebezhetőségeken, de mégis valós kockázatot jelentenek. A beküldött anyagokat az OpenAI Safety és Security Bug Bounty csoportjai kiértékelik, és azokat a hatókörtől és a felelősségi körtől függően a két program közül a megfelelőhöz irányíthatják.
Az új Safety Bug Bounty(új ablakban nyílik meg) program az alább felsorolt AI-specifikus biztonsági forgatókönyvekre összpontosít:
Ügynöki kockázatok, az MCP-t is beleértve
- Harmadik féltől származó utasítás injekció és adatlopás: amikor a támadó által felhasznált szöveg megbízhatóan képes eltéríteni az áldozat ügynökét (beleértve a böngészőt, a ChatGPT‑ügynököt és hasonló ügynökalapú termékeket), hogy kártékony műveletek végrehajtására vagy a felhasználó érzékeny adatainak kiszivárogtatására vegye rá. A viselkedésnek legalább az esetek 50%-ában reprodukálhatónak kell lennie.
- Egy ágensalapú OpenAI-termék nem engedélyezett műveletet hajt végre az OpenAI weboldalán nagy léptékben.
- Egy ügynökalapú OpenAI-termék valamely, a fentiekben nem szereplő, potenciálisan káros műveletet hajt végre. Az érvényes jelentéseknek valószínűsíthetően bekövetkező anyagi kárra kell utalniuk.
- Az MCP-kockázatok tesztelésének meg kell felelnie a harmadik felek szolgáltatási feltételeinek.
Nem nyilvános OpenAI-információk
- Az érveléssel kapcsolatos, nem nyilvános információkat visszaadó modellgenerálások.
- Olyan sebezhetőségek, amelyek más nem nyilvános OpenAI-információkat tesznek közzé.
Fiók- és platformintegritás
- Fiók- és platformintegritást érintő sebezhetőségek, mint például az automatizálás elleni védelmi mechanizmusok megkerülése, a fiókmegbízhatósági jelzések manipulálása, a fiókkorlátozások/-felfüggesztések/-kitiltások kijátszása és hasonló problémák.
- Azokat a problémákat, amelyek lehetővé teszik, hogy a felhasználók az engedélyezett jogosultságaikon túl funkciókhoz, adatokhoz vagy egyéb lehetőségekhez férjenek hozzá, jelenteni kell a Security Bug Bounty(új ablakban nyílik meg) felé.
Bár a jailbreakelés kívül esik e program hatókörén, időről időre privát bug bounty kampányokat indítunk, amelyek bizonyos káros tartalomtípusokra, például a ChatGPT ügynök és a GPT‑5 biokockázati tartalmaival kapcsolatos problémákra összpontosítanak. Arra biztatjuk az érdeklődő kutatókat, hogy jelentkezzenek ezekre a programokra, amikor azok meghirdetésre kerülnek.
A fent felsorolt kategóriákon kívül, ha a kutatók olyan hibákat azonosítanak, amelyek közvetlen felhasználói károkat okozhatnak, és konkrét, elkülönített javítási lépések állnak rendelkezésre, ezek esetenként jutalmazhatónak minősülhetnek. Az általános tartalomszabályzat-megkerülések, amelyek nem járnak kimutatható biztonsági vagy visszaélési hatással, kívül esnek e program hatókörén. Például azok a „jailbreakelések", amelyek eredményeképpen a modell durva nyelvezetet használ, vagy keresőmotorokon keresztül könnyen megtalálható információkat ad vissza, kívül esnek a program hatókörén.
A részvétel iránt érdeklődő kutatók a Safety Bug Bounty(új ablakban nyílik meg) keretében pályázhatnak. Alig várjuk, hogy együtt dolgozhassunk a kutatókkal, az etikus hackerekkel, valamint a biztonsággal foglalkozó közösséggel egy biztonságos AI-ökoszisztéma megteremtése érdekében.


