12 febbraio 2025

Condivisione dell’ultimo Model Spec

Abbiamo aggiornato il documento Model Spec in base ai feedback esterni e alle continue ricerche che effettuiamo sul comportamento desiderato del modello.

Leggi il Model Spec

Caricamento in corso...

Stiamo condividendo un importante aggiornamento del Model Spec, un documento che definisce il comportamento dei nostri modelli AI. Questo aggiornamento rafforza il nostro impegno a favore della personalizzazione, della trasparenza e della libertà intellettuale di esplorare, discutere e creare con l’IA senza restrizioni arbitrarie, assicurando al tempo stesso che vengano mantenute le barriere di sicurezza per ridurre il rischio di danni reali. Il Model Spec si basa sui fondamenti che abbiamo introdotto lo scorso maggio, attingendo alla nostra esperienza di applicazione in vari contesti, dalla ricerca sull’allineamento al servizio agli utenti di tutto il mondo.

Condividiamo anche alcuni primi risultati sull’aderenza dei modelli ai principi del Model Spec in un’ampia gamma di scenari. Questi risultati evidenziano i progressi compiuti nel tempo e le aree in cui possiamo ancora migliorare. Il Model Spec, così come i nostri modelli, continuerà a evolversi man mano che lo applicheremo, lo condivideremo e ascolteremo il feedback delle parti interessate. Per favorire un ampio utilizzo e la collaborazione, rilasciamo questa versione del Model Spec nel pubblico dominio con una licenza Creative Commons CC0. Ciò significa che gli sviluppatori e i ricercatori possono utilizzarlo, adattarlo e costruirci sopra liberamente nel loro lavoro.

Obiettivi e principi

L’obiettivo di OpenAI è quello di creare modelli utili, sicuri e in linea con le esigenze di utenti e sviluppatori, portando avanti la nostra missione di garantire che l’intelligenza artificiale generale vada a beneficio di tutta l’umanità. Per raggiungere questo obiettivo, dobbiamo distribuire in modo iterativo modelli che promuovano il lavoro di sviluppatori e utenti, evitando al contempo che tali modelli causino danni agli utenti o ad altri, e mantenendo la licenza di OpenAI per operare.

Questi obiettivi possono a volte essere in conflitto e il Model Spec ne bilancia i compromessi istruendo il modello a seguire una catena di comando chiaramente definita, insieme a principi aggiuntivi che stabiliscono i limiti e i comportamenti predefiniti per vari scenari. Questo framework dà la priorità al controllo dell’utente e dello sviluppatore, pur rimanendo all’interno di confini chiari e ben definiti:

Catena di comando: Definisce il modo in cui il modello dà priorità alle istruzioni della piattaforma (OpenAI), dello sviluppatore e dell’utente. Il Model Spec consiste prevalentemente in linee guida che riteniamo utili in molti casi, ma che possono essere ignorate da utenti e sviluppatori. Ciò consente a utenti e sviluppatori di personalizzare completamente il comportamento del modello entro i limiti stabiliti dalle regole a livello di piattaforma.
Cercare la verità insieme: Come un assistente umano ad elevata integrità, i nostri modelli dovrebbero aiutare gli utenti a prendere le decisioni migliori. Ciò implica un attento equilibrio tra (1) evitare di indirizzare gli utenti con un’agenda, privilegiando l’obiettività e la disponibilità a esplorare qualsiasi argomento da qualsiasi prospettiva, e (2) lavorare per comprendere gli obiettivi dell’utente, chiarire le ipotesi e i dettagli incerti e fornire un feedback critico quando appropriato. Si tratta di richieste che abbiamo sentito e a proposito delle quali abbiamo migliorato.
Fare il lavoro migliore: Stabilisce gli standard di base per la competenza, tra cui l’accuratezza dei fatti, la creatività e l’uso programmatico.
Rimanere nei limiti: Spiega in che modo il modello bilancia l’autonomia dell’utente con le precauzioni per evitare danni o abusi. Questa nuova versione intende essere completa e presentare tutti i motivi che guidano i nostri modelli nel rifiuto delle richieste di utenti o sviluppatori.
Essere disponibili: Descrive lo stile di conversazione predefinito del modello (caldo, empatico e disponibile) e come questo stile può essere adattato.
Utilizzare uno stile appropriato: Fornisce indicazioni predefinite sulla formattazione e sulla consegna. Che si tratti di punti ordinati, di frammenti di codice concisi o di una conversazione vocale, il nostro obiettivo è garantire chiarezza e usabilità.

Sostenere la libertà intellettuale

Il Model Spec aggiornato abbraccia esplicitamente la libertà intellettuale: l’idea che l’IA debba consentire alle persone di esplorare, discutere e creare senza restrizioni arbitrarie, a prescindere da quanto un argomento possa essere impegnativo o controverso. In un mondo in cui gli strumenti dell’intelligenza artificiale stanno dando sempre più forma ai discorsi, il libero scambio di informazioni e prospettive è una necessità per il progresso e l’innovazione.

Questa filosofia è incorporata nelle sezioni "Rimanere nei limiti" e "Cercare la verità insieme". Per esempio, mentre il modello non dovrebbe mai fornire istruzioni dettagliate per costruire una bomba o per violare la privacy personale, è incoraggiato a fornire risposte ponderate a domande politicamente o culturalmente sensibili, senza promuovere alcuna agenda particolare. In sostanza, abbiamo rafforzato il principio secondo cui nessuna idea è intrinsecamente off limits per la discussione, a patto che il modello non stia causando danni significativi all’utente o ad altri (ad esempio, la realizzazione di atti di terrorismo).

Misurare i progressi

Per comprendere meglio le prestazioni reali, abbiamo iniziato a raccogliere una serie di prompt impegnativi, volti a verificare l’aderenza dei modelli a ciascun principio del Model Spec. Questi prompt sono stati creati utilizzando una combinazione di generazione di modelli e revisione umana da parte di esperti, garantendo la copertura di scenari tipici e più complessi.

Un grafico a barre con barre bianche e gialle alternate su sfondo nero, che rappresenta i confronti tra i dati. Le barre gialle hanno un motivo a puntini, che aggiunge consistenza alla presentazione visiva.

I risultati preliminari mostrano miglioramenti significativi nell’aderenza del modello al Model Spec rispetto al nostro sistema migliore del maggio scorso. Una parte di questa differenza può essere attribuita agli aggiornamenti delle politiche, ma riteniamo che la maggior parte di essa derivi da un maggiore allineamento. Sebbene i progressi siano incoraggianti, riconosciamo che c'è ancora un notevole margine di crescita.

Lo consideriamo l’inizio di un processo continuo. Intendiamo continuare ad ampliare il nostro set di sfide con nuovi esempi, soprattutto casi scoperti attraverso l’uso del mondo reale, che i nostri modelli e il Model Spec non affrontano ancora completamente.

Nel definire questa versione del Model Spec, abbiamo incorporato i feedback della prima versione e gli insegnamenti tratti dalla ricerca sull’allineamento e dall’impiego nel mondo reale. In futuro vogliamo prendere in considerazione un contributo pubblico molto più ampio. Per mettere a punto i processi a tal fine, abbiamo condotto studi pilota con circa 1.000 persone, ognuna delle quali ha esaminato i comportamenti modello, le regole proposte e ha condiviso i propri pensieri. Anche se questi studi non riflettono ancora ampie prospettive, le prime intuizioni hanno informato direttamente alcune modifiche. Si tratta di un processo continuo e iterativo e ci impegniamo a imparare e a perfezionare il nostro approccio.

Open sourcing del Model Spec

Dedichiamo questa nuova versione del Model Spec al pubblico dominio con licenza Creative Commons CC0. Ciò significa che gli sviluppatori e i ricercatori possono liberamente utilizzare, adattare o costruire sul Model Spec il proprio lavoro. Inoltre, i prompt utilizzati in precedenza vengono resi disponibili in open-source per la valutazione e puntiamo a rilasciare ulteriori codici, artefatti e strumenti per la valutazione e l’allineamento delle Spec in futuro.

Questi prompt e il sorgente del Model Spec sono disponibili in un nuovo repository Github⁠(si apre in una nuova finestra), dove pubblicheremo regolarmente nuove versioni del Model Spec.

Prossime novità

Man mano che i nostri sistemi di IA progrediscono, continueremo a iterare su questi principi, a chiedere il feedback della comunità e a condividere apertamente i nostri progressi. In futuro, non pubblicheremo post sul blog per ogni aggiornamento del Model Spec. Invece, è sempre possibile trovare e seguire gli ultimi aggiornamenti su model-spec.openai.com⁠(si apre in una nuova finestra).

Il nostro obiettivo è quello di abilitare continuamente nuovi casi d’uso in sicurezza, evolvendo il nostro approccio guidato dalla ricerca e dall’innovazione continue. Dato il ruolo crescente dell’IA nella nostra vita quotidiana, è essenziale continuare a imparare, perfezionare e impegnarsi apertamente. Questo approccio riflette non solo ciò che abbiamo imparato finora, ma anche la nostra convinzione che l’allineamento dell’IA sia un viaggio continuo, al quale speriamo vi unirete. Se hai un feedback su questo Spec, puoi condividerlo qui.

Authors

OpenAI