Illum, OpenAI qed tniedi programm pubbliku ta’ Safety Bug Bounty(jinfetaħ f’tieqa ġdida) iffukat fuq l-identifikazzjoni ta’ abbuż tal-IA u riskji tas-sigurtà fil-prodotti tagħna. Hekk kif it-teknoloġija tal-IA qed tevolvi malajr, hekk ukoll qed jiżdiedu l-modi potenzjali kif tista’ tintuża ħażin. L-għan tagħna hu li niżguraw li s-sistemi tagħna jibqgħu siguri u protetti kontra użu ħażin jew abbuż li jista’ jwassal għal ħsara konkreta.
Dan il-programm il-ġdid se jikkumplimenta l-programm Security Bug Bounty(jinfetaħ f’tieqa ġdida) ta’ OpenAI billi jaċċetta kwistjonijiet li joħolqu riskji sinifikanti ta’ abbuż u sigurtà, anke jekk ma jissodisfawx il-kriterji għal vulnerabbiltà ta’ sigurtà. Permezz ta’ dan il-programm, nistennew bil-ħerqa li nkomplu nissieħbu ma’ riċerkaturi tas-sigurtà u s-safety biex ngħinuna nidentifikaw u nindirizzaw kwistjonijiet li jaqgħu barra mill-vulnerabbiltajiet ta’ sigurtà konvenzjonali iżda xorta joħolqu riskji reali. Is-sottomissjonijiet se jiġu vvalutati mit-timijiet ta’ Safety u Security Bug Bounty ta’ OpenAI, u jistgħu jiġu ridiretti bejn iż-żewġ programmi skont l-ambitu u s-sjieda.
Il-programm il-ġdid ta’ Safety Bug Bounty(jinfetaħ f’tieqa ġdida) jiffoka fuq ix-xenarji ta’ sigurtà speċifiċi għall-IA elenkati hawn taħt:
Riskji aġentiċi inkluż MCP
- Injezzjoni tal-prompts minn terzi u exfiltrazzjoni tad-data: meta test minn attakkant ikun jista’ b’mod affidabbli jaħtaf l-aġent ta’ vittma (inklużi Browser, ChatGPT Agent, u prodotti aġentiċi simili) biex iqarraq bih iwettaq azzjoni ta’ ħsara jew jiżvela l-informazzjoni sensittiva tal-utent. L-imġiba trid tkun riproduċibbli mill-inqas 50% tal-ħin.
- Prodott aġentiku ta’ OpenAI iwettaq azzjoni mhux permessa fuq is-sit web ta’ OpenAI fuq skala kbira.
- Prodott aġentiku ta’ OpenAI iwettaq xi azzjoni potenzjalment ta’ ħsara li mhijiex elenkata hawn fuq. Rapporti validi hawnhekk iridu jindikaw ħsara plawżibbli u sostanzjali.
- Kull ittestjar għar-riskju MCP irid jikkonforma mat-termini tas-servizz ta’ kwalunkwe parti terza.
Informazzjoni Proprjetarja ta’ OpenAI
- Ġenerazzjonijiet tal-mudell li jirritornaw informazzjoni proprjetarja relatata mar-raġunament.
- Vulnerabbiltajiet li jesponu informazzjoni proprjetarja oħra ta’ OpenAI.
Integrità tal-Kont u tal-Pjattaforma
- Vulnerabbiltajiet fl-integrità tal-kont u f’sinjali tal-integrità tal-pjattaforma, bħal li jiġu evitati kontrolli kontra l-awtomazzjoni, jiġu mmanipulati sinjali ta’ fiduċja tal-kont, jiġu evitati restrizzjonijiet/sospensjonijiet/projbizzjonijiet tal-kont, u kwistjonijiet simili.
- Kwistjonijiet li jippermettu lill-utenti jaċċessaw karatteristiċi, data, jew funzjonalitajiet lil hinn mill-permessi awtorizzati għandhom jiġu rrappurtati lill-programm Security Bug Bounty(jinfetaħ f’tieqa ġdida).
Għalkemm il-jailbreaks huma barra mill-ambitu ta’ dan il-programm, aħna minn żmien għal żmien immexxu kampanji privati ta’ bug bounty iffukati fuq ċerti tipi ta’ ħsara, bħal kwistjonijiet ta’ kontenut ta’ Biorisk f’ChatGPT Agent u GPT‑5. Nistiednu lir-riċerkaturi interessati japplikaw għal dawn il-programmi meta joħorġu.
Barra mill-kategoriji elenkati hawn fuq, jekk ir-riċerkaturi jidentifikaw difetti li jiffaċilitaw mogħdijiet diretti għal ħsara lill-utent u passi ta’ rimedjazzjoni azzjonabbli u distinti, dawn jistgħu jitqiesu fl-ambitu għal premjijiet każ b’każ. Bypasses ġenerali tal-politika tal-kontenut mingħajr impatt dimostrabbli fuq is-sigurtà jew l-abbuż huma barra mill-ambitu ta’ dan il-programm. Pereżempju, “jailbreaks” li jwasslu biex il-mudell juża lingwaġġ goff jew jirritorna informazzjoni li tista’ tinstab faċilment permezz ta’ magni tat-tiftix huma barra mill-ambitu.
Riċerkaturi interessati li jipparteċipaw jistgħu japplikaw permezz tal-programm tagħna ta’ Safety Bug Bounty(jinfetaħ f’tieqa ġdida). Nistennew bil-ħerqa li naħdmu flimkien ma’ riċerkaturi, hackers etiċi, u l-komunità tas-safety u s-sigurtà fit-tfittxija ta’ ekosistema tal-IA sigura.


