De seneste modelspecifikationer
Vi har foretaget opdateringer af modelspecifikationerne baseret på ekstern feedback og vores løbende forskning i at forme den ønskede modeladfærd.
Vi deler her en væsentlig opdatering af vores modelspecifikationer – det dokument, der definerer, hvordan vi ønsker, at vores AI-modeller skal opføre sig. Opdateringen styrker vores løbende målsætning om at forbedre tilpasningsevnen, gennemsigtighed og intellektuel frihed til at udforske, debattere og skabe med AI, uden vilkårlige begrænsninger, samtidig med at der fortsat er indbyggede sikkerhedsforanstaltninger, som mindsker risikoen for reel skade. Opdateringen bygger videre på det fundament, vi introducerede i maj sidste år, og trækker på vores erfaringer med at anvende det i en bred vifte af sammenhænge – fra alignment-forskning til praktisk brug hos mennesker over hele verden.
Vi deler også nogle tidlige resultater af modellernes overholdelse af modelspecifikationernes principper på tværs af en bred vifte af scenarier. Resultaterne viser både fremgang over tid og hvor der fortsat er plads til forbedring. Modelspecifikationerne vil – ligesom vores modeller – løbende blive videreudviklet i takt med, at vi anvender dem, deler dem og lytter til feedback fra relevante aktører. For at fremme bred anvendelse og samarbejde offentliggør vi denne version af modelspecifikationerne under en Creative Commons CC0-licens. Det betyder, at udviklere og forskere frit kan bruge, tilpasse og bygge videre på dem i deres eget arbejde.
OpenAI’s mål er at udvikle modeller, der er nyttige, sikre og afstemt efter brugernes og udviklernes behov – og samtidig fremmer vores overordnede mission om at sikre, at kunstig generel intelligens (AGI) kommer hele menneskeheden til gode. For at opnå dette mål er vi nødt til gradvist at implementere modeller, der giver udviklerne og brugerne større handlekraft, samtidig med at vi forebygger alvorlig skade og opretholder OpenAI's licens til at drive virksomhed.
Disse målsætninger kan til tider være i konflikt med hinanden. Modelspecifikationerne balancerer fordelene mellem dem ved at instruere modellen i at følge en klart defineret kommandokæde sammen med yderligere principper, der sætter grænser og standardadfærd for forskellige scenarier. Denne ramme prioriterer bruger- og udviklerkontrol, samtidig med at den holder sig inden for klare, veldefinerede grænser:
- Kommandovej: Definerer, hvordan modellen prioriterer instruktioner fra platformen (OpenAI), udvikleren og brugeren i rækkefølge. Hovedparten af modelspecifikationerne består af retningslinjer, vi mener er nyttige i mange tilfælde, men som kan tilsidesættes af brugerne og udviklerne. Det giver brugerne og udviklerne mulighed for fuldt ud at tilpasse modellens adfærd inden for de grænser, der er fastsat af reglerne for hele platformen.
- Søg sandheden sammen: Modellen skal – som en menneskelig assistent med høj integritet – hjælpe brugeren med at træffe informerede beslutninger. Det indebærer en nøje balance mellem (1) ikke at påvirke brugeren med en skjult dagsorden og som udgangspunkt være objektiv, men samtidig åben for at udforske emner fra flere perspektiver, og (2) aktivt at forsøge at forstå brugerens mål, afklare forudsætninger og uklarheder og yde kritisk feedback, når det er relevant – et ønske, vi har lyttet til og forbedret løbende.
- Levér bedst muligt: Opstiller grundlæggende standarder for kvalitet og faglighed – herunder faktuel nøjagtighed, kreativitet og programmeringskompetence.
- Oprethold rammerne: Beskriver, hvordan modellen balancerer brugerens autonomi med nødvendige forholdsregler mod at muliggøre skade eller misbrug. Den opdaterede version er mere omfattende og dækker alle de årsager, der ligger til grund for, at modellen kan afvise anmodninger fra brugere eller udviklere.
- Vær imødekommende: Beskriver modellens standardmæssige samtalestil – varm, empatisk og hjælpsom – samt hvordan stilen kan tilpasses forskellige behov og kontekster.
- Brug en passende stil: Giver vejledning om form og formidling. Uanset om det drejer sig om overskuelige punktlister, præcise kodeuddrag eller samtaler i et naturligt toneleje, er målet klarhed og brugervenlighed. Uanset om det er pæne punktopstillinger, koncise kodestykker eller en stemmesamtale, er vores mål at sikre klarhed og brugervenlighed.
De opdaterede modelspecifikationer lægger stor vægt på intellektuel frihed – ideen om, at AI skal give folk mulighed for at udforske, debattere og skabe uden vilkårlige begrænsninger, uanset hvor udfordrende eller kontroversielt et emne måtte være. I en verden, hvor AI-værktøjer i stigende grad former diskursen, er fri udveksling af information og perspektiver en nødvendighed for fremskridt og innovation.
Denne filosofi er indlejret i afsnittene “oprethold rammerne” og “søg sandheden sammen”. For eksempel bør modellen aldrig give detaljerede instruktioner om, hvordan man bygger en bombe eller krænker en persons privatliv, men den opfordres til at give tankevækkende svar på politisk eller kulturelt følsomme spørgsmål – uden at fremme nogen bestemt dagsorden. I bund og grund har vi styrket princippet om, at ingen idé i sig selv er forbudt at diskutere, så længe modellen ikke forårsager betydelig skade på brugeren eller andre (f.eks. udførelse af terrorhandlinger).
For bedre at kunne forstå præstationen i den virkelige verden er vi begyndt at samle et udfordrende sæt spørgsmål, der er designet til at teste, hvor godt modellerne overholder hvert princip i modelspecifikationen. Spørgsmålene blev udformet ved hjælp af en kombination af modelgenerering og menneskelig ekspertgennemgang, for at sikre, at der er både typiske og mere komplekse scenarier.
Foreløbige resultater viser betydelige forbedringer i modellens overholdelse af modelspecifikationen sammenlignet med vores bedste system i maj sidste år. Mens noget af den forskel kan tilskrives politiske opdateringer, mener vi, at det meste skyldes forbedret tilpasning. Selvom fremskridtene er opløftende, er vi klar over, at der stadig er masser af plads til forbedringer.
Vi ser det som starten på en løbende proces. Vi vil fortsætte med at udvide vores udfordringssæt med nye eksempler – især sager, der viser sig gennem brug i den virkelige verden, som vores modeller og modelspecifikationer endnu ikke tager fuldt ud højde for.
I arbejdet med denne version af modelspecifikationerne har vi inddraget feedback fra den første version samt erfaringer fra tilpasningsforskning og praktisk anvendelse. Fremover ønsker vi at inddrage langt bredere offentlig feedback. Som led i den proces har vi gennemført pilotundersøgelser med omkring 1.000 personer, der hver især har vurderet modellens adfærd, foreslåede retningslinjer og delt deres tanker. Selvom disse studier endnu ikke afspejler hele spektret af synspunkter, har tidlige indsigter allerede ført til konkrete justeringer. Vi ser det som en løbende og gradvis proces og er fortsat engagerede i at lære og forbedre vores tilgang.
Vi dedikerer den nye version af modelspecifikationerne til det offentlige domæne under en Creative Commons CC0-licens. Det betyder, at udviklere og forskere frit kan bruge, tilpasse og bygge videre på modelspecifikationerne i deres eget arbejde. Derudover open-sourcer vi også de evalueringsforespørgsler, der er anvendt i ovenstående analyser – og vi har planer om at udgive yderligere kode, værktøjer og data til brug i evaluering og tilpasning af specifikationerne.
Du kan finde forespørgslerne og modelspecifikationerne i et nyt Github repository(åbner i et nyt vindue), hvor vi regelmæssigt kommer til at udgive nye versioner.
Efterhånden som vores AI-systemer udvikler sig, vil vi fortsætte med at gentage disse principper, invitere til offentlig feedback og åbent dele vores fremskridt. Fremover vil vi ikke udgive blogindlæg for hver opdatering af modelspecifikationerne. I stedet kan du altid finde og følge de seneste opdateringer på model-spec.openai.com(åbner i et nyt vindue).
Vores mål er løbende at muliggøre nye use cases på en sikker måde og udvikle vores tilgang med udgangspunkt i løbende forskning og innovation. AI's tiltagende betydning i vores dagligdag gør det vigtigt at blive ved med at lære, finjustere og engagere sig åbent. Denne tilgang afspejler ikke kun, hvad vi har lært indtil nu, men også vores tro på, at tilpasning af AI er en løbende rejse – en rejse, vi håber, du vil tage med på sammen med os. Har du feedback til disse specifikationer, kan du dele den her.