12. februar 2025

Deler de nyeste modellspesifikasjonene

Vi har oppdatert modellspesifikasjonene basert på ekstern tilbakemelding og den fortsatte forskningen vår for å forme ønskelig modellatferd.

Les modellspesifikasjonene

Laster inn …

Vi deler en stor oppdatering av modellspesifikasjonene, et dokument som definerer hvordan vi vil at AI-modellene våre skal oppføre seg. Denne oppdateringen forsterker forpliktelsen vår til tilpassbarhet, åpenhet og intellektuell frihet til å utforske, debattere og opprette med AI uten vilkårlige begrensninger, mens vi sikrer at beskyttelser er på plass for å redusere faren for ekte skade. Den bygger på grunnlaget vi introduserte i mai i fjor, basert på opplevelsen vår fra å bruke den i forskjellige kontekster fra tilpasningsforskning til å betjene brukere fra hele verden.

Vi deler også noen tidlige resultater om modelloverholdelse med prinsippene i modellspesifikasjonene fra et bredt spekter av scenarioer. Disse funnene fremhever fremgang over tid samt områder med forbedringspotensiale. Modellspesifikasjonene, i likhet med modellene våre, utvikles videre når vi bruker dem, deler dem og lytter til tilbakemelding fra interessenter. For å støtte bred bruk og samarbeid frigir vi denne versjonen av modellspesifikasjonene til offentligheten under en Creative Commons CC0-lisens. Dette betyr at utviklere og forskere kan bruke, tilpasse og bygge på den fritt i sitt eget arbeid.

Mål og prinsipper

OpenAIs mål er å opprette modeller som er nyttige, sikre og tilpasset til behovet til brukere og utviklere mens de fremmer målet vårt om å sikre at kunstig generell intelligens er til nytte for hele menneskeheten. For å oppnå dette målet må vi rulle ut modeller som styrker utviklere og brukere iterativt, mens vi forhindrer at modellene våre forårsaker alvorlig skade for brukerne våre og andre, og opprettholder OpenAIs lisens til å drive virksomhet.

Disse målene kan noen ganger være i strid med hverandre, og modellspesifikasjonene balanserer avveiingen mellom dem ved å instruere modellen til å følge en tydelig definert kommandokjede samt ytterligere prinsipper som angir grenser og standardatferder for forskjellige scenarioer. Dette rammeverket prioriterer bruker- og utviklerkontroll mens det holdes innen tydelige, godt definerte grenser:

Kommandokjede: Definerer hvordan modellen prioriterer instruksjoner fra plattformen (OpenAI), utvikleren og brukeren i rekkefølge. Mesteparten av modellspesifikasjonene består av retningslinjer som vi mener er nyttige i mange tilfeller, men kan overstyres av brukere og utviklere. Dette lar brukere og utviklere tilpasse modellatferden fullt ut innen grenser angitt av regler på plattformnivå.
Søk sannheten sammen: Som en menneskelig assistent med høy integritet skal modellene våre la brukerne ta sine egne beste avgjørelser. Dette involverer en nøye balanse mellom (1) å unngå å styre brukere med en agenda med objektivitet som standardgrunnlag mens den er villig til å utforske hvilket som helst emne fra hvilket som helst perspektiv, og (2) å jobbe for å forstå brukerens mål, tydeliggjøre antagelser og utydelige detaljer, samt gi kritisk tilbakemelding når det er passende – forespørsler vi har hørt og forbedret.
Gjør best mulig arbeid: Angir grunnleggende standarder for kompetanse, inkludert saklig nøyaktighet, kreativitet og programmatisk bruk.
Hold deg innenfor grensene: Forklarer hvordan modellen balanserer brukerautonomi med forholdsregler for å unngå tilrettelegging for skade eller uriktig bruk. Denne versjonen skal være omfattende og fullt ut dekke alle årsakene vi mener at modellene våre skal bruke for å nekte bruker- eller utviklerforespørsler.
Vær imøtekommende: Beskriver modellens standardstil for samtale – varm, empatisk og nyttig – og hvordan denne stilen kan tilpasses.
Bruk hensiktsmessig stil: Gir standardveiledning for formatering og levering. Uansett om det er rene punktlister, kortfattede kodesnutter eller en stemmesamtale er målet vårt å sikre tydelighet og brukbarhet.

Overholdelse av intellektuell frihet

De oppdaterte modellspesifikasjonene omfavner spesifikt intellektuell frihet – idéen om at AI skal istandsette folk til å utforske, debattere og opprette uten vilkårlige begrensninger – uansett hvor utfordrende eller kontroversielt et emne er. I en verden der AI-verktøy i økende grad former debatter, er den frie utvekslingen av informasjon og perspektiver en nødvendighet for fremdrift og innovasjon.

Denne filosofien er innlemmet i delene «Hold deg innenfor grensene» og «Søk sannheten sammen». For eksempel, selv om modellen aldri skal gi detaljert instruksjon for bygging av en bombe eller krenkelse av personvern, oppmuntres den til å gi gjennomtenkte svar på politisk eller kulturelt sensitive spørsmål, uten å fremme en bestemt agenda. Vi forsterker prinsippet om at ingen idéer nødvendigvis er uaktuelle å diskutere, så lenge modellen ikke forårsaker betydelig skade for brukeren eller andre (f.eks. utføre terrorhandlinger).

Vurdering av fremdrift

For å få en bedre forståelse av ytelse i den virkelige verdenen har vi begynt å samle inn et utfordrende sett med meldinger designet til å teste hvor godt modeller følger hvert prinsipp i modellspesifikasjonene. Disse meldingene ble opprettet med en kombinasjon av modellgenerasjon og menneskelig gjennomgang av eksperter, som sikrer dekning av både vanlige og mer komplekse scenarier.

A bar chart with alternating white and yellow bars on a black background, representing data comparisons. The yellow bars have a dotted pattern, adding texture to the visual presentation.

Foreløpige resultater viser betydelige forbedringer av modelloverholdelse av modellspesifikasjonene sammenlignet med det beste systemet vårt i mai i fjor. Selv om noe av denne forskjellen kan tilskrives oppdateringer av retningslinjer, mener vi at mesteparten kommer fra forbedret tilpasning. Selv om fremgangen er lovende, anerkjenner vi at det fremdeles er betydelig rom for vekst.

Vi anser dette som starten av en pågående prosess. Vi planlegger å fortsette å utvide utfordringssettet med nye eksempler, spesielt tilfeller som avdekkes via bruk i den virkelige verdenen, som modellene våre og modellspesifikasjonene ikke håndterer fullt ut ennå.

Ved forming av denne versjonen av modellspesifikasjonene innlemmet vi tilbakemelding fra den første versjonen samt lærdom fra tilpasningsforskning og utrulling i den virkelige verden. I fremtiden vil vi ta hensyn til mye bredere offentlige innspill. For å utvikle prosessene våre for å nå dette målet har vi utført pilotstudier med omtrent 1000 enkeltpersoner, som hver gjennomgår modellatferd, foreslåtte regler og deler tankene sine. Selv om disse studiene ikke gjenspeiler brede perspektiver ennå, har tidlig innsikt direkte informert noen modifikasjoner. Vi anerkjenner at dette er en pågående, iterativ prosess og er fremdeles forpliktet til å lære og finjustere tilnærmelsen vår.

Åpen kildekode for modellspesifikasjonene

Vi dedikerer denne nye versjonen av modellspesifikasjonene til offentligheten i henhold til en Creative Commons CC0-lisens. Dette betyr at utviklere og forskere kan bruke, tilpasse og bygge på modellspesifikasjonene fritt i sitt eget arbeid. Vi bruker også åpen kildekode for evalueringsmeldingene som brukes ovenfor, og har mål om å frigi mer kode, artefakter og verktøy for evaluering og tilpasning av spesifikasjoner i fremtiden.

Du finner disse meldingene og kilden til modellspesifikasjonene i et nytt Github-repositorium⁠(åpnes i et nytt vindu), der vi planlegger å regelmessig publisere nye versjoner av modellspesifikasjoner fremover.

Hva skjer videre?

Når AI-systemene våre utvikles, kommer vi til å fortsette å iterere på disse prinsippene, invitere til tilbakemelding fra fellesskapet og dele fremdriften vår. I fremtiden kommer vi ikke til å publisere blogginnlegg for hver oppdatering av modellspesifikasjonene. I stedet kan du når som helst finne og spore de siste oppdateringene på model-spec.openai.com⁠(åpnes i et nytt vindu).

Målet vårt er å kontinuerlig muliggjøre nye bruksområder på en trygg måte og utvikle tilnærmingen vår veiledet av pågående forskning og innovasjon. Den voksende rollen AI har i dagliglivet vårt gjør det nødvendig å fortsette å lære, fininnstille og engasjere oss på en åpen måte. Denne tilnærmingen gjenspeiler ikke bare det vi har lært til nå, men troen vår på at tilpasning av AI er en pågående reise – som vi håper du blir med på. Hvis du har tilbakemeldinger om disse spesifikasjonene, kan du dele dem her.

Authors

OpenAI