12. helmikuuta 2025

Jaamme uusimman mallimäärityksen

Olemme tehneet päivityksiä mallimääritykseen saamamme palautteen ja jatkuvan tutkimuksemme perusteella halutun mallikäyttäytymisen muokkaamiseksi.

Lue mallimääritys

Ladataan...

Jaamme merkittävän päivityksen mallimääritykseen (Model Spec), joka määrittelee, miten haluamme tekoälymalliemme toimivan. Tämä päivitys vahvistaa sitoutumistamme muokattavuuteen, läpinäkyvyyteen ja älylliseen vapauteen tutkia, keskustella ja luoda tekoälyn avulla ilman mielivaltaisia rajoituksia, mutta samalla varmistaen, että suojamenetelmät ovat voimassa todellisen vahinkoriskin vähentämiseksi. Se rakentuu perusteille, jotka esittelimme viime toukokuussa ja hyödyntää kokemuksiamme sen soveltamisesta erilaisissa yhteyksissä kohdistustutkimuksesta käyttäjien palvelemiseen eri puolilla maailmaa.

Jaamme myös alustavia tuloksia siitä, miten malli noudattaa mallimäärityksen periaatteita laajasti eri skenaarioissa. Nämä havainnot korostavat ajan myötä tapahtunutta edistystä sekä alueita, jotka vielä vaativat kehittämistä. Kuten omat mallimmekin, mallimääritys kehittyy jatkuvasti sitä mukaa, kun sovellamme sitä, jaamme sitä ja kuuntelemme sidosryhmiltä saatua palautetta. Laajan käytön ja yhteistyön tukemiseksi julkaisemme tämän version mallimäärityksestä vapaasti käytettäväksi Creative Commons CC0 -lisenssillä. Se tarkoittaa, että kehittäjät ja tutkijat voivat käyttää, soveltaa ja hyödyntää sitä vapaasti omassa työssään.

Tavoitteet ja periaatteet

OpenAI:n tavoitteena on luoda malleja, jotka ovat hyödyllisiä, turvallisia ja käyttäjien ja kehittäjien tarpeiden mukaisia, samalla kun edistämme tehtäväämme varmistaa, että yleinen tekoäly hyödyttää koko ihmiskuntaa. Tämän tavoitteen saavuttamiseksi meidän on iteratiivisesti otettava käyttöön malleja, jotka voimaannuttavat kehittäjiä ja käyttäjiä samalla, kun estämme mallejamme aiheuttamasta vakavaa haittaa käyttäjillemme tai muille, ja säilytämme OpenAI:n toimintaluvan.

Nämä tavoitteet voivat joskus olla ristiriidassa keskenään, ja mallimääritys tasapainottaa niiden välisiä kompromisseja ohjeistamalla mallia noudattamaan selkeästi määriteltyä komentoketjua sekä lisäperiaatteita, jotka asettavat rajat ja oletusarvoiset käyttäytymismallit eri skenaarioissa. Tämä viitekehys priorisoi käyttäjän ja kehittäjän hallinnan pysyen samalla selkeiden ja hyvin määriteltyjen rajojen sisällä:

Komentoketju: Määrittää, miten malli priorisoi alustan (OpenAI), kehittäjän ja käyttäjän antamien ohjeiden järjestyksen. Suurin osa mallimäärityksestä koostuu ohjeista, joiden uskomme olevan hyödyllisiä monissa tapauksissa, mutta käyttäjät ja kehittäjät voivat ohittaa ne. Se antaa käyttäjille ja kehittäjille mahdollisuuden mukauttaa mallin toimintaa täysin alustatason sääntöjen asettamissa rajoissa.
Etsitään totuutta yhdessä: Kuten erittäin luotettava ihmisavustaja, malliemme tulisi antaa käyttäjille mahdollisuus tehdä omia parhaita päätöksiään. Tämä edellyttää huolellista tasapainottelua seuraavien kahden vaiheen välillä: (1) käyttäjien ohjaamisen välttäminen tietyn agendan avulla, objektiivisuuden tavoittelun laiminlyönti samalla, kun ollaan halukkaita tutkimaan mitä tahansa aihetta mistä tahansa näkökulmasta, ja (2) pyrkimys käyttäjän tavoitteiden ymmärtämiseen, oletusten ja epävarmojen yksityiskohtien selventäminen sekä kriittisen palautteen antaminen tarvittaessa. Ne ovat pyyntöjä, joita olemme kuulleet ja joita olemme parantaneet.
Tee parasta työtä: Asettaa perusvaatimukset osaamiselle, mukaan lukien tosiasioiden oikeellisuus, luovuus ja ohjelmallinen käyttö.
Pysy rajojen sisällä: Selittää, miten malli tasapainottaa käyttäjän autonomiaa varotoimilla, joilla vältetään vahingon tai väärinkäytön edistäminen. Tämän uuden version on tarkoitus olla kattava ja käsitellä kaikki syyt, joiden vuoksi malliemme voivat hylätä käyttäjien tai kehittäjien pyynnöt.
Ole helposti lähestyttävä: Kuvailee mallin oletusarvoista keskustelutyyliä – lämmin, empaattinen ja avulias – ja sitä, miten tätä tyyliä voidaan mukauttaa.
Käytä sopivaa tyyliä: Tarjoaa oletusohjeita muotoilusta ja toimituksesta. Tavoitteemme on varmistaa selkeys ja käytettävyys olipa kyse sitten siisteistä luettelokohdista, ytimekkäistä koodinpätkistä tai äänikeskustelusta.

Älyllisen vapauden puolustaminen

Päivitetty mallimääritys tukee nimenomaisesti älyllistä vapautta, eli ajatusta, että tekoälyn tulisi antaa ihmisille mahdollisuus tutkia, keskustella ja luoda ilman mielivaltaisia rajoituksia, olipa aihe kuinka haastava tai kiistanalainen tahansa. Maailmassa, jossa tekoälytyökalut muokkaavat yhä enemmän keskustelua, tiedon ja näkökulmien vapaa vaihto on välttämätöntä edistykselle ja innovoinnille.

Tämä filosofia on sisällytetty osioihin ”Pysy rajojen sisällä” ja ”Etsitään totuutta yhdessä”. Esimerkiksi, vaikka mallin ei tulisi koskaan antaa yksityiskohtaisia ohjeita pommin rakentamiseen tai yksityisyyden loukkaamiseen, sitä kannustetaan antamaan harkittuja vastauksia poliittisesti tai kulttuurisesti arkaluontoisiin kysymyksiin, mutta olemaan edistämättä mitään tiettyä agendaa. Pohjimmiltaan olemme vahvistaneet periaatetta, jonka mukaan mikään idea ei ole lähtökohtaisesti keskustelun ulkopuolella, kunhan malli ei aiheuta merkittävää haittaa käyttäjälle tai muille (esim. terroritekojen toteuttaminen).

Edistymisen mittaaminen

Ymmärtääksemme paremmin tosielämän suorituskykyä olemme ryhtyneet keräämään haastavaa kokoelmaa kysymyksiä, joilla testataan, kuinka hyvin mallit noudattavat mallimäärityksen kutakin periaatetta. Nämä kehotteet luotiin yhdistämällä mallien luomista ja asiantuntijoiden suorittamaa ihmisen tekemää tarkastusta, mikä varmisti sekä tyypillisten että monimutkaisempien skenaarioiden kattavuuden.

Pylväsdiagrammi, jossa on vuorottelevat valkoiset ja keltaiset palkit mustalla taustalla ja joka edustaa tietovertailuja. Keltaisissa palkeissa on pistekuvio, joka lisää visuaaliseen esitykseen tekstuuria.

Alustavat tulokset osoittavat merkittäviä parannuksia siihen, miten malli noudattaa mallimääritystä verrattuna parhaaseen järjestelmäämme viime toukokuussa. Vaikka osa tästä erosta saattaa johtua käytäntöjen päivityksistä, uskomme, että suurin osa siitä johtuu parantuneesta yhdenmukaisuudesta. Vaikka kehitys on rohkaisevaa, ymmärrämme, että kehitykselle on vielä paljon tilaa.

Pidämme tätä käynnissä olevan prosessin alkuna. Aiomme laajentaa haastevalikoimaamme uusilla esimerkeillä, erityisesti tosielämän käytössä esiin tulleilla tapauksilla, joita mallimme ja mallimääritys eivät vielä täysin käsittele.

Tämän mallimäärityksen version muotoilussa otimme huomioon ensimmäisestä versiosta saadun palautteen sekä kohdistustutkimuksesta ja käytännön käyttöönotosta saadut kokemukset. Tulevaisuudessa haluamme ottaa huomioon paljon laajemman yleisöpalautteen. Kehittääksemme prosesseja sitä varten olemme tehneet pilottitutkimuksia noin 1 000 henkilön kanssa. Heistä jokainen on tarkastellut mallikäyttäytymistä, ehdotettuja sääntöjä ja jakanut niistä ajatuksiaan. Vaikka nämä tutkimukset eivät vielä heijasta laajoja näkökulmia, alustavat havainnot ovat suoraan vaikuttaneet joihinkin muutoksiin. Näemme sen jatkuvana, iteratiivisena prosessina ja olemme edelleen sitoutuneita oppimaan ja hiomaan lähestymistapaamme.

Mallimäärityksen avoin lähdekoodi

Julkaisemme tämän uuden version mallimäärityksestä Creative Commons CC0 -lisenssin ehdoilla. Se tarkoittaa, että kehittäjät ja tutkijat voivat vapaasti käyttää, mukauttaa tai hyödyntää mallimääritystä omassa työssään. Olemme myös julkaisseet edellä käytetyt arviointikehotteet avoimesti, ja pyrimme julkaisemaan tulevaisuudessa lisää koodia, artefakteja ja työkaluja määritysten arviointiin ja yhdenmukaistamiseen.

Löydät nämä kehotteet ja mallimäärityksen lähdekoodin uudesta Github-varastosta⁠(avautuu uudessa ikkunassa), jossa aiomme jatkossa julkaista säännöllisesti mallimäärityksen uusia versioita.

Mitä seuraavaksi?

Tekoälyjärjestelmiemme kehittyessä jatkamme näiden periaatteiden kehittämistä, pyydämme palautetta yhteisöltä ja jaamme edistymistämme avoimesti. Jatkossa emme julkaise blogikirjoituksia jokaisesta mallimääritysten päivityksestä. Sen sijaan viimeisimpiä päivityksiä voi aina löytää ja seurata osoitteessa model-spec.openai.com⁠(avautuu uudessa ikkunassa).

Tavoitteenamme on jatkuvasti mahdollistaa uusia käyttötapauksia turvallisesti ja kehittää lähestymistapaamme jatkuvan tutkimuksen ja innovaatioiden ohjaamana. Tekoälyn kasvava rooli jokapäiväisessä elämässämme tekee jatkuvasta oppimisesta, jalostumisesta ja avoimesta osallistumisesta välttämätöntä. Tämä lähestymistapa heijastaa paitsi tähänastista oppimaamme myös uskomustamme siitä, että tekoälyn yhdenmukaistaminen on jatkuva matka, johon toivomme sinun liittyvän mukaamme. Jos sinulla on palautetta tästä määrityksestä, voit jakaa sen täällä.

Authors

OpenAI