25 ta’ Marzu 2026

Nintroduċu l-programm OpenAI Safety Bug Bounty

Ittestjar għal kwistjonijiet ta’ sigurtà u abbuż madwar OpenAI

Illum, OpenAI qed tniedi programm pubbliku ta’ Safety Bug Bounty⁠(jinfetaħ f’tieqa ġdida) iffukat fuq l-identifikazzjoni ta’ abbuż tal-IA u riskji tas-sigurtà fil-prodotti tagħna. Hekk kif it-teknoloġija tal-IA qed tevolvi malajr, hekk ukoll qed jiżdiedu l-modi potenzjali kif tista’ tintuża ħażin. L-għan tagħna hu li niżguraw li s-sistemi tagħna jibqgħu siguri u protetti kontra użu ħażin jew abbuż li jista’ jwassal għal ħsara konkreta.

Dan il-programm il-ġdid se jikkumplimenta l-programm Security Bug Bounty⁠(jinfetaħ f’tieqa ġdida) ta’ OpenAI billi jaċċetta kwistjonijiet li joħolqu riskji sinifikanti ta’ abbuż u sigurtà, anke jekk ma jissodisfawx il-kriterji għal vulnerabbiltà ta’ sigurtà. Permezz ta’ dan il-programm, nistennew bil-ħerqa li nkomplu nissieħbu ma’ riċerkaturi tas-sigurtà u s-safety biex ngħinuna nidentifikaw u nindirizzaw kwistjonijiet li jaqgħu barra mill-vulnerabbiltajiet ta’ sigurtà konvenzjonali iżda xorta joħolqu riskji reali. Is-sottomissjonijiet se jiġu vvalutati mit-timijiet ta’ Safety u Security Bug Bounty ta’ OpenAI, u jistgħu jiġu ridiretti bejn iż-żewġ programmi skont l-ambitu u s-sjieda.

Ħarsa ġenerali lejn il-programm

Il-programm il-ġdid ta’ Safety Bug Bounty⁠(jinfetaħ f’tieqa ġdida) jiffoka fuq ix-xenarji ta’ sigurtà speċifiċi għall-IA elenkati hawn taħt:

Riskji aġentiċi inkluż MCP

Injezzjoni tal-prompts minn terzi u exfiltrazzjoni tad-data: meta test minn attakkant ikun jista’ b’mod affidabbli jaħtaf l-aġent ta’ vittma (inklużi Browser, ChatGPT Agent, u prodotti aġentiċi simili) biex iqarraq bih iwettaq azzjoni ta’ ħsara jew jiżvela l-informazzjoni sensittiva tal-utent. L-imġiba trid tkun riproduċibbli mill-inqas 50% tal-ħin.
Prodott aġentiku ta’ OpenAI iwettaq azzjoni mhux permessa fuq is-sit web ta’ OpenAI fuq skala kbira.
Prodott aġentiku ta’ OpenAI iwettaq xi azzjoni potenzjalment ta’ ħsara li mhijiex elenkata hawn fuq. Rapporti validi hawnhekk iridu jindikaw ħsara plawżibbli u sostanzjali.
Kull ittestjar għar-riskju MCP irid jikkonforma mat-termini tas-servizz ta’ kwalunkwe parti terza.

Informazzjoni Proprjetarja ta’ OpenAI

Ġenerazzjonijiet tal-mudell li jirritornaw informazzjoni proprjetarja relatata mar-raġunament.
Vulnerabbiltajiet li jesponu informazzjoni proprjetarja oħra ta’ OpenAI.

Integrità tal-Kont u tal-Pjattaforma

Vulnerabbiltajiet fl-integrità tal-kont u f’sinjali tal-integrità tal-pjattaforma, bħal li jiġu evitati kontrolli kontra l-awtomazzjoni, jiġu mmanipulati sinjali ta’ fiduċja tal-kont, jiġu evitati restrizzjonijiet/sospensjonijiet/projbizzjonijiet tal-kont, u kwistjonijiet simili.
Kwistjonijiet li jippermettu lill-utenti jaċċessaw karatteristiċi, data, jew funzjonalitajiet lil hinn mill-permessi awtorizzati għandhom jiġu rrappurtati lill-programm Security Bug Bounty⁠(jinfetaħ f’tieqa ġdida).

Għalkemm il-jailbreaks huma barra mill-ambitu ta’ dan il-programm, aħna minn żmien għal żmien immexxu kampanji privati ta’ bug bounty iffukati fuq ċerti tipi ta’ ħsara, bħal kwistjonijiet ta’ kontenut ta’ Biorisk f’ChatGPT Agent⁠ u GPT‑5⁠. Nistiednu lir-riċerkaturi interessati japplikaw għal dawn il-programmi meta joħorġu.

Barra mill-kategoriji elenkati hawn fuq, jekk ir-riċerkaturi jidentifikaw difetti li jiffaċilitaw mogħdijiet diretti għal ħsara lill-utent u passi ta’ rimedjazzjoni azzjonabbli u distinti, dawn jistgħu jitqiesu fl-ambitu għal premjijiet każ b’każ. Bypasses ġenerali tal-politika tal-kontenut mingħajr impatt dimostrabbli fuq is-sigurtà jew l-abbuż huma barra mill-ambitu ta’ dan il-programm. Pereżempju, “jailbreaks” li jwasslu biex il-mudell juża lingwaġġ goff jew jirritorna informazzjoni li tista’ tinstab faċilment permezz ta’ magni tat-tiftix huma barra mill-ambitu.

Kif tipparteċipa

Riċerkaturi interessati li jipparteċipaw jistgħu japplikaw permezz tal-programm tagħna ta’ Safety Bug Bounty⁠(jinfetaħ f’tieqa ġdida). Nistennew bil-ħerqa li naħdmu flimkien ma’ riċerkaturi, hackers etiċi, u l-komunità tas-safety u s-sigurtà fit-tfittxija ta’ ekosistema tal-IA sigura.

2026

Awtur

OpenAI

Kompli aqra

Ara kollox

OpenAI u Hugging Face jindirizzaw inċident ta’ sigurtà

Sigurtà21 ta’ Lul, 2026

Safety and alignment in an era of long-horizon models

Sigurtà20 ta’ Lul, 2026

Why teens deserve access to safe AI — card image

Għaliex l-adoloxxenti jistħoqqilhom IA sikura

Sigurtà16 ta’ Lul, 2026