Come si sono diffusi gli output con goblin nei modelli di IA: cronologia, causa principale e correzioni dietro le stranezze di comportamento di GPT-5.
Scopri come il Model Spec di OpenAI funge da quadro pubblico per il comportamento del modello, bilanciando sicurezza, libertà degli utenti e responsabilità con l’evoluzione dei sistemi di IA.
Come OpenAI usa il monitoraggio della chain of thought per studiare i comportamenti disallineati negli agenti interni di coding, analizzando implementazioni reali per individuare i rischi e rafforzare le misure di sicurezza dell’IA.
IH-Challenge addestra i modelli a dare priorità alle istruzioni affidabili, migliorando la gerarchia delle istruzioni, la controllabilità della sicurezza e la resistenza agli attacchi di iniezione di prompt.
OpenAI presenta CoT-Control e scopre che i modelli di ragionamento faticano a controllare le proprie chain of thought, rafforzando la monitorabilità come misura di sicurezza per l’IA.
Un nuovo preprint estende le ampiezze single-minus ai gravitoni, con GPT-5.2 Pro che aiuta a derivare e verificare ampiezze di gravitoni non nulle nella gravità quantistica.