I dag lancerer OpenAI et offentligt Safety Bug Bounty-program(åbner i et nyt vindue), der fokuserer på at identificere AI-misbrug og sikkerhedsrisici på tværs af vores produkter. Efterhånden som AI-teknologien udvikler sig hurtigt, udvikler de potentielle måder, den kan misbruges på, sig også. Vores mål er at sikre, at vores systemer forbliver sikre og beskyttede mod misbrug eller skadelig anvendelse, som kan føre til konkret skade.
Dette nye program vil supplere OpenAIs Security Bug Bounty(åbner i et nyt vindue) ved at acceptere problemer, der udgør betydelige misbrugs- og sikkerhedsrisici, selvom de ikke opfylder kriterierne for en sikkerhedssårbarhed. Gennem dette program ser vi frem til fortsat at samarbejde med forskere inden for sikkerhed og tryghed for at hjælpe os med at identificere og håndtere problemer, der falder uden for konventionelle sikkerhedssårbarheder, men stadig udgør reelle risici. Indsendelser vil blive vurderet af OpenAI’s Safety- og Security Bug Bounty-teams og kan blive omdirigeret mellem de to programmer afhængigt af omfang og ejerskab.
Det nye Safety Bug Bounty(åbner i et nyt vindue)-program fokuserer på AI-specifikke sikkerhedsscenarier, som er angivet nedenfor:
Risici ved agentbaserede systemer, herunder MCP
- Tredjeparts-prompt injection og dataeksfiltrering: Når angriberens tekst pålideligt er i stand til at kapre et offers agent (herunder Browser, ChatGPT Agent og lignende agentprodukter) for at narre det til at udføre en skadelig handling eller lække brugerens følsomme oplysninger. Adfærden skal kunne reproduceres mindst 50 % af gangene.
- Et OpenAI-produkt med handlekraft udfører en ikke-tilladt handling på OpenAI's hjemmeside i stor skala.
- Et agentbaseret OpenAI-produkt udfører en potentielt skadelig handling, som ikke er nævnt ovenfor. Gyldige rapporter her skal angive sandsynlig og væsentlig skade.
- Enhver test af MCP-risiko skal overholde tredjeparters brugsvilkår.
Fortrolige oplysninger fra OpenAI
- Modelgenereringer, der returnerer fortrolige oplysninger vedrørende ræsonnementet.
- Sårbarheder, der afslører andre fortrolige oplysninger fra OpenAI.
Konto- og platformintegritet
- Sårbarheder i signaler vedrørende kontointegritet og platformintegritet, såsom omgåelse af kontrolforanstaltninger mod automatisering, manipulation af signaler om kontotillid, omgåelse af kontobegrænsninger, -suspensioner og -forbud samt lignende problemer.
- Problemer, der giver brugere adgang til funktioner, data eller funktionaliteter ud over deres autoriserede tilladelser, skal rapporteres til Security Bug Bounty(åbner i et nyt vindue).
Selvom jailbreaks ikke er omfattet af dette program, kører vi regelmæssigt private bug bounty-kampagner med fokus på specifikke skadetyper, såsom problemer med biorisikoindhold i ChatGPT Agent og GPT‑5. Vi opfordrer interesserede forskere til at ansøge om disse programmer, når de bliver tilgængelige.
Ud over de ovennævnte kategorier kan forskere, hvis de identificerer fejl, der fremmer direkte veje til brugerskade, og handlingsrettede, diskrete afhjælpningstrin, betragtes som belønningsmuligheder fra sag til sag. Generelle omgåelser af indholdspolitikker uden påviselig indvirkning på sikkerhed eller misbrug falder uden for dette programs omfang. For eksempel er "jailbreaks", der resulterer i, at modellen bruger uhøfligt sprog eller returnerer oplysninger, der let kan findes via søgemaskiner, uden for anvendelsesområdet.
Forskere, der er interesserede i at deltage, kan ansøge via vores Safety Bug Bounty(åbner i et nyt vindue) -program. Vi ser frem til at arbejde sammen med forskere, etiske hackere og sikkerheds- og tryghedsfællesskabet i arbejdet hen imod et sikkert AI-økosystem.


