Dela de senaste modellspecifikationerna
Vi har gjort uppdateringar i modellspecifikationerna baserat på extern feedback och vår fortsatta forskning i att forma önskat modellbeteende.
Vi delar en större uppdatering i modellspecifikationerna, ett dokument som beskriver hur vi vill att våra AI-modeller ska bete sig. Den här uppdateringen förstärker vårt åtagande till anpassningsbarhet, transparens och intellektuell frihet att utforska, debattera och skapa med AI utan godtyckliga restriktioner, medan skyddsgränserna hålls på plats för att minska risken för verkliga skador. Det bygger på grunderna vi introducerade i maj förra året, och bygger på vår erfarenhet i att tillämpa den i olika sammanhang, från inriktningsforskning till att tjäna användare runtom i världen.
Vi delar även några tidiga resultat på modellens följsamhet efter modellspecifikationernas principer inom många olika scenarier. Dessa fynd markerar framstegen med tiden, samt områden inom vilka vi kan göra förbättringar. Modellspecifikationen, precis som modellerna, fortsätter att utvecklas allt eftersom vi tillämpar den, och lyssnar på feedback från intressenter. För att stödja bred användning och samarbete släpper vi den här versionen av modellspecifikationerna i allmän egendom under en Creative Commons CC-licens. Detta innebär att utvecklare och forskare fritt kan använda, anpassa och utveckla den i sina egna arbeten.
OpenAI:s mål är att skapa modeller som är användbara, säkra och i linje med användares och utvecklares behov, medan vi avancerar vårt uppdrag för att försäkra att artificiell generell intelligens gynnar hela mänskligheten. För att uppnå detta mål måste vi iterativt släppa modeller som bemyndigar utvecklare och användare, medan vi förhindrar att våra modeller orsakar allvarliga skador på våra användare och andra, samt upprätthåller OpenAI:s licens att bedriva verksamhet.
Dessa mål kan ibland strida mot varandra. Modellspecifikationen balanserar kompromisserna mellan dem genom att instruera modellen till att följa en tydligt definierad hierarki, samt ytterligare principer som fastställer gränser och standardbeteenden för olika scenarier. Ramverket prioriterar användares och utvecklares kontroll medan det förhåller sig inom tydliga, väldefinierade gränser:
- Hierarki: Definierar hur modellen prioriterar instruktioner från plattformen (OpenAI), utvecklare och användare i ordning. Modellspecifikationen består mestadels av riktlinjer som vi anser vara användbara i många fall, men kan åsidosättas av användare och utvecklare. Detta bemyndigar användare och utvecklare till att helt anpassa modellens beteende inom gränserna som fastställts av reglerna på plattformsnivå.
- Sök efter sanningen tillsammans: Precis som en mänsklig assistent med hög integritet ska våra modeller bemyndiga användare till att fatta sina egna bästa beslut. Denna innebär en noggrann balans mellan att (1) undvika styrandet av användare med en agenda, tillämpning av objektivitet som standard samtidigt som man är villig att utforska alla ämnen från alla perspektiv, och (2) försöka förstå användarens mål, förtydliga antaganden och otydliga detaljer, samt ge kritisk feedback när det är lämpligt, förfrågningar som vi har hört och förbättrat.
- Utför arbetet på bästa vis: Sätter grundläggande standarder för kompetens, inklusive faktisk noggrannhet, kreativitet och programmatisk användning.
- Håll dig inom gränserna: Förklarar hur modellen balanserar användarautonomi med försiktighetsåtgärder för att undvika främjandet av skador och missbruk. Den nya versionen är avsedd att vara komplett, och omfattar alla anledningar vi avser för våra modeller att vägra uppfylla förfrågningar från användare och utvecklare.
- Var tillmötesgående: Beskriver modellens standardstil vid samtal: varm, empatisk och hjälpsam, och hur den stilen kan anpassas.
- Använd lämplig stil: Ger standardriktlinjer om formatering och leverans. Oavsett om det är prydliga punktlistor, kortfattade kodutdrag eller ett röstsamtal är vårt mål att försäkra klarhet och användbarhet.
Den uppdaterade modellspecifikationen anammar intellektuell frihet; idén att AI ska bemyndiga personer att utforska, debattera och skapa utan godtyckliga restriktioner, oavsett hur utmanande eller kontroversiellt ämnet kan vara. I en värld där AI-verktyg alltmer utformar debatten är utbyte av information och perspektiv en nödvändighet för framsteg och innovation.
Den här filosofin är inbäddad i avsnitten ”Håll dig inom gränserna” och ”Sök efter sanningen tillsammans”. Medan modellen t.ex. aldrig skulle ge detaljerade instruktioner om hur man tillverkar en bomb eller utför personligt integritetsintrång, uppmuntras den till att ge tankeväckande svar på känsliga frågor inom politik och kultur, utan att främja någon särskild agenda. Vi har helt enkelt förstärkt principen att ingen idé är egentligen förbjudet att diskutera, så länge modellen inte orsakar väsentlig skada på användaren eller andra (t.ex. utför terroristdåd).
För att bättre förstå verklig prestanda har vi börjat samla in en utmanande uppsättning prompter, som har utformats för att testa hur väl modeller följer varje princip inom modellspecifikationen. Dessa prompter skapades med en kombination av modellgenerering och granskning av mänskliga experter, för att försäkra oss om att vi täcker både typiska och mer komplexa scenarier.
Preliminära resultat visar betydande förbättringar i modellens följsamhet till modellspecifikationen i jämförelse med vårt bästa system i maj förra året. Medan en del av skillnaden kan tillskrivas policyuppdateringar anser vi att den till mestadels beror på förbättrad inriktning. Fastän framstegen är uppmuntrande förstår vi att det fortfarande finns stort utrymme för utveckling.
Vi ser detta som början på en fortlöpande process. Vi planerar att fortsätta utvidga vår uppsättning utmaningar med nya exempel, särskilt fall som upptäckts genom verklig användning, som våra modeller och modellspecifikationen ännu inte riktigt har åtgärdat.
Den här versionen av modellspecifikationen har vi använt feedback från den första versionen samt kunskaper från inriktningsforskning och verklig användning. I framtiden vill vi överväga allmänhetens åsikter i mycket bredare utsträckning. För att utveckla processer i detta syfte har vi utfört pilotstudier med cirka 1 000 personer, som var och en har granskat modellbeteende, föreslagit regler och delat sina åsikter. Medan dessa studier ännu inte återspeglar bredare perspektiv har tidiga insikter direkt påverkat vissa modifieringar. Vi förstår att det är en löpande, iterativ process och fortsätter att lära oss och finjustera vårt tillvägagångssätt.
Vi släpper den nya versionen av modellspecifikationen i allmän egendom under en Creative Commons CC-licens. Detta innebär att utvecklare och forskare fritt kan använda, anpassa och utveckla modellspecifikationen i sina egna arbeten. Vi släpper också utvärderingsprompterna som används ovan i allmän egendom, och syftar att släppa ytterligare kod, artefakter och verktyg för specifikationsutvärdering och inriktning i framtiden.
Du hittar prompterna och modellspecifikationen i ett nytt Github-lager(öppnas i ett nytt fönster), där vi planerar att publicera nya versioner av modellspecifikationen regelbundet framöver.
Allt eftersom våra AI-system utvecklas kommer vi att fortsätta uppdatera dessa principer, be allmänheten om feedback och öppet dela våra framsteg. Framöver kommer vi inte att publicera blogginlägg för varje uppdatering av modellspecifikationen. Istället kan du alltid hitta och spåra de senaste uppdateringarna på model-spec.openai.com(öppnas i ett nytt fönster).
Vårt mål är att konsekvent aktivera nya användningsfall på säkert sätt genom att utveckla vårt tillvägagångssätt efter pågående forskning och innovation. AI:s växande roll i vardagslivet gör det väsentligt att vi fortsätter lära, finjustera och diskutera öppet. Detta tillvägagångssätt återspeglar inte bara vad vi har lärt oss hittills, utan även vår tro på att anpassa AI är en pågående resa, som vi hoppas att du följer med oss på. Om du har feedback på denna specifikation kan du dela den här.