Hur "goblin"-data spreds i AI-modeller: tidslinje, grundorsak och åtgärder bakom personlighetsdrivna egenheter i GPT-5.
Läs om hur OpenAI:s modellspecifikation fungerar som ett offentligt ramverk för modellbeteende som balanserar säkerhet, användarfrihet och ansvarsskyldighet i takt med att AI-systemen utvecklas.
Hur OpenAI använder tankekedjeövervakning för att studera felinriktning i interna kodningsagenter – genom att analysera verkliga implementationer för att identifiera risker och stärka säkerhetsåtgärder för AI.
IH-Challenge tränar modeller att prioritera tillförlitliga instruktioner, vilket resulterar i förbättrad instruktionshierarki, kontrollbarhet för säkerhet och motståndskraft mot promptinjektionsattacker.
OpenAI introducerar CoT-Control och upptäcker att resonemangsmodeller har svårt att kontrollera sina tankekedjor, vilket förstärker övervakningsbarheten som en säkerhetsåtgärd för AI.
Ett nytt utkast utökar enkla minusamplituder till gravitoner där GPT-5.2 Pro hjälper till att härleda och verifiera nollgravitonträdamplituder i kvantgravitation.