GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch – our most robust yet – are built to deliver these models safely and at scale, around the world.
OpenAI e Molecule.one mostrano come un sistema di chimica IA quasi autonomo basato su GPT-5.4 ha migliorato una reazione chiave per la sintesi di farmaci, facendo progredire la ricerca in chimica farmaceutica.
Presentazione di LifeSciBench, benchmark scritto e rivisto da esperti per valutare come i sistemi di AI gestiscono compiti e decisioni reali nelle scienze della vita.
Come si sono diffusi gli output con goblin nei modelli di IA: cronologia, causa principale e correzioni dietro le stranezze di comportamento di GPT-5.
Scopri come la specifica del modello di OpenAI funge da quadro pubblico per il comportamento del modello, bilanciando sicurezza, libertà degli utenti e responsabilità con l’evoluzione dei sistemi di IA.
Come OpenAI usa il monitoraggio della chain of thought per studiare i comportamenti disallineati negli agenti interni di coding, analizzando implementazioni reali per individuare i rischi e rafforzare le misure di sicurezza dell’IA.
IH-Challenge addestra i modelli a dare priorità alle istruzioni affidabili, migliorando la gerarchia delle istruzioni, la controllabilità della sicurezza e la resistenza agli attacchi di iniezione di prompt.