Kif infirxu outputs ta’ tip goblin fil-mudelli tal-IA: kronoloġija, kawża ewlenija u soluzzjonijiet għad-dettalji mmexxija mill-personalità fl-imġiba ta’ GPT-5.
Sir af kif l-Ispeċifikazzjoni tal-Mudell ta’ OpenAI sservi bħala qafas pubbliku għall-imġiba tal-mudell, billi tibbilanċja s-sikurezza, il-libertà tal-utent u r-responsabbiltà hekk kif is-sistemi tal-IA javvanzaw.
Kif OpenAI tuża l-monitoraġġ tal-katina tal-ħsieb biex tistudja allinjament ħażin f’aġenti interni tal-coding—tanaliżża skjeramenti fid-dinja reali biex tiskopri riskji u ssaħħaħ is-salvagwardji tas-sigurtà tal-IA.
IH-Challenge iħarreġ il-mudelli biex jagħtu prijorità lil istruzzjonijiet fdati, u jtejjeb il-ġerarkija tal-istruzzjonijiet, il-kontrollabbiltà tas-sigurtà, u r-reżistenza għal attakki ta' injezzjoni tal-prompts.
OpenAI tintroduċi CoT-Control u ssib li l-mudelli tar-raġunament jitħabtu biex jikkontrollaw il-katini tal-ħsieb tagħhom, u b’hekk isaħħu l-monitorabbiltà bħala salvagwardja għas-sikurezza tal-IA.
Preprint ġdid jestendi l-amplitudnijiet single-minus għall-gravitoni, b'GPT-5.2. Pro jgħin biex jiġu derivati l-amplitudnijiet tal-gravitoni mhux żero fil-gravità kwantistika.