Како се гоблински резултати шире у AI моделима: хронологија, основни узрок и исправке иза необичности у понашању GPT-5 вођених личношћу.
Saznajte kako OpenAI-jeve Specifikacije modela služe kao javni okvir za ponašanje modela, usklađujući bezbednost, slobodu korisnika i odgovornost kako AI sistemi napreduju.
Како OpenAI користи надзор начина резоновања да проучава неусклађеност код интерних агената за кодирање — анализирајући примене у стварном свету ради откривања ризика и јачања мера безбедности AI система.
IH-Challenge обучава моделе да дају приоритет поузданим инструкцијама, побољшавајући хијерархију инструкција, управљивост безбедношћу и отпорност на нападе уметањем инструкције.
OpenAI представља CoT-Control и утврђује да модели резоновања тешко контролишу свој начин резоновања, што учвршћује надзирљивост као заштитну меру за безбедност AI-а.
Нови препринт проширује single-minus амплитуде на гравитоне, уз помоћ GPT-5.2 Pro у извођењу и провери ненултих гравитонских tree амплитуда у квантној гравитацији.