Autamme ihmisiä silloin, kun he tarvitsevat sitä eniten
ChatGPT:n käytön kasvaessa maailmanlaajuisesti olemme nähneet ihmisten kääntyvän sen puoleen paitsi hakujen, koodauksen ja kirjoittamisen vuoksi, mutta myös syvästi henkilökohtaisten asioiden, kuten elämänohjeiden(avautuu uudessa ikkunassa), valmennuksen(avautuu uudessa ikkunassa) ja tuen(avautuu uudessa ikkunassa) vuoksi.
Tässä mittakaavassa kohtaamme joskus ihmisiä, jotka ovat vakavassa henkisessä ja emotionaalisessa ahdingossa. Kirjoitimme tästä muutama viikko sitten ja suunnittelimme jakavamme aiheesta lisää seuraavan suuren päivityksemme jälkeen. Viimeaikaiset sydäntäsärkevät tapaukset, joissa ihmiset ovat käyttäneet ChatGPT:tä akuuttien kriisien keskellä, ovat kuitenkin vaikuttaneet meihin syvällisesti. Uskomme, että nyt on tärkeää jakaa niistä lisää.
Tavoitteenamme on, että työkalumme ovat mahdollisimman hyödyllisiä ihmisille. Sen vuoksi parannamme jatkuvasti sitä, miten mallimme tunnistavat ja reagoivat merkkeihin henkisestä ja emotionaalisesta ahdingosta, ja yhdistävät ihmisiä hoitoon asiantuntijan ohjauksessa.
Maailman sopeutuessa tähän uuteen teknologiaan, meillä on syvällinen vastuu auttaa niitä, jotka sitä eniten tarvitsevat. Haluamme selvittää, mihin ChatGPT on suunniteltu, miten järjestelmiämme voidaan parantaa ja mitä tulevaa työtä suunnittelemme.
Tavoitteenamme ei ole hakea huomiota ihmisiltä. Sen sijaan, että mittaisimme menestystä käytetyllä ajalla tai napsautuksilla, välitämme enemmän siitä, että olemme aidosti hyödyllisiä. Olemme rakentaneet ChatGPT:hen useita kerrostettuja suojatoimia sen varalta, että keskustelussa tulee ilmi henkilön olevan haavoittuvainen ja mahdollisesti vaarassa.
Tunnistamme ja reagoimme empaattisesti.
Vuoden 2023 alusta lähtien mallimme on koulutettu olemaan antamatta itsetuhoisia ohjeita ja siirtymään tukevaan ja empaattiseen kielenkäyttöön. Esimerkiksi jos joku kirjoittaa haluavansa satuttaa itseään, ChatGPT on koulutettu olemaan tottelematta ja sen sijaan tunnustamaan hänen tunteensa ja ohjaamaan heitä hakemaan apua.
Lisäksi syvyyssuuntaisen puolustusajattelumme mukaisesti vastaukset, jotka ovat malliemme turvallisuuskoulutuksen vastaisia (luokittelijamme tunnistamina) estetään automaattisesti. Alaikäisten ja uloskirjautuneiden käyttäjien suhteen suojaukset ovat vahvempia. Myös itsetuhoiset kuvat on estetty kaikilta, ja alaikäisten suhteen suojaus on vahvempi.
Hyvin pitkien istuntojen aikana ChatGPT kehottaa käyttäjiämme pitämään tauon.
Ohjaamme ihmisiä reaalimaailman resursseihin.
ChatGPT on koulutettu ohjaamaan hakemaan apua terveydenhuollon ammattilaisilta, jos joku ilmaisee itsemurha-aikeen. Yhdysvalloissa ChatGPT ohjaa soittamaan itsemurha- ja kriisipuhelimeen numerossa 988, Isossa-Britanniassa ottamaan yhteyttä Samaritans-järjestöön ja muualla osoitteeseen findahelpline.com(avautuu uudessa ikkunassa). Tämä logiikka on sisäänrakennettu mallin toimintaan.
Teemme tiivistä yhteistyötä yli 90 lääkärin, psykiatrien, lastenlääkäreiden ja yleislääkäreiden, kanssa yli 30 maassa ja kokoamme yhteen mielenterveyden, nuorten kehityksen ja ihmisen ja tietokoneen vuorovaikutuksen asiantuntijoista koostuvan neuvoa-antavan ryhmän varmistaaksemme, että lähestymistapamme heijastaa uusinta tutkimusta ja parhaita käytäntöjä.
Eskaloimme riskin muille aiheutuvasta fyysisestä vahingosta ihmisen tarkastettavaksi.
Kun havaitsemme käyttäjiä, joilla on aikeita vahingoittaa muita, ohjaamme heidän keskustelunsa erityisiin kanaviin, joissa pieni tiimi tarkastaa ne. Tiimi on koulutettu käyttöä koskeviin käytäntöihimme ja sillä on valtuudet ryhtyä toimiin, mukaan lukien tilien estäminen. Jos ihmistarkastajat katsovat, että tapaukseen liittyy välitön vakavan fyysisen vahingon uhka muille, voimme siirtää sen viranomaisille. Emme tällä hetkellä siirrä itsetuhoisia tapauksia viranomaisille kunnioittaaksemme ihmisten yksityisyyttä, koska vuorovaikutus ChatGPT:n kanssa on luonteeltaan ainutlaatuisen yksityistä.
Parannamme jatkuvasti malliemme reagointia arkaluontoisissa tilanteissa ja työskentelemme parhaillaan kohdennettujen turvallisuusparannusten parissa useilla osa-alueilla, mukaan lukien emotionaalinen riippuvuus, mielenterveyskriisit ja mielistely.
Elokuussa julkaisimme GPT‑5:n ChatGPT:n oletusmallina. Kaiken kaikkiaan GPT‑5 on osoittanut merkittäviä parannuksia esimerkiksi epäterveellisen emotionaalisen riippuvuuden välttämisessä, mielistelyn vähentämisessä ja mallien epäideaalisten vastausten esiintyvyyden vähentämisessä mielenterveydellisissä hätätilanteissa yli 25 prosentilla verrattuna 4o-malliin. GPT‑5 perustuu myös uuteen turvallisuuden koulutusmenetelmään nimeltä turvalliset täydennykset, joka opettaa mallia olemaan mahdollisimman hyödyllinen pysyen samalla turvallisuusrajoissa. Se voi tarkoittaa osittaisen tai yleisluontoisen vastauksen antamista yksityiskohtaisen vastauksen sijaan, joka ei välttämättä ole turvallinen.
Näistä suojatoimista huolimatta on ollut hetkiä, jolloin arkaluontoisissa tilanteissa järjestelmämme eivät ole toimineet tarkoitetulla tavalla. Tässä on joitakin osa-alueita, joita pyrimme parantamaan.
Turvatoimien vahvistaminen pitkissä keskusteluissa.
Turvatoimemme toimivat luotettavammin yleisissä, lyhyissä keskusteluissa. Olemme ajan myötä oppineet, että nämä turvatoimet voivat joskus olla vähemmän luotettavia pitkissä vuorovaikutustilanteissa: edestakaisen väittelyn lisääntyessä osa mallin turvallisuuskoulutuksesta voi heikentyä. Esimerkiksi ChatGPT saattaa ohjata soittamaan itsemurha-apupuhelimeen, kun joku mainitsee ensimmäisen kerran aikomuksen, mutta useiden pidemmän ajan kuluessa lähetettyjen viestien jälkeen se saattaa lopulta tarjota vastauksen, joka on vastoin turvatoimiamme. Juuri tällaista romahdusta pyrimme estämään. Vahvistamme näitä lieventämiskeinoja, jotta mallit pysyvät luotettavina pitkissä keskusteluissa, ja tutkimme tapoja varmistaa vankka toiminta useissa keskusteluissa. Tällä tavoin, jos joku ilmaisee itsemurha-aikeen yhdessä keskustelussa ja aloittaa myöhemmin toisen, malli voi silti reagoida asianmukaisesti.
Sisällön estämisen tarkentaminen.
Olemme nähneet tapauksia, joissa sisältöä ei estetty vaikka niin olisi pitänyt tehdä. Nämä aukot syntyvät yleensä siksi, että luokittelija aliarvioi sen vakavuuden mitä näki. Hienosäädämme kyseisiä kynnysarvoja niin, että suojaukset käynnistyvät silloin, kun niiden pitäisi.
Tärkein prioriteettimme on varmistaa, ettei ChatGPT pahenna vaikeita hetkiä.
Työ ei lopu edellä mainittujen korjaamiseen. Suunnittelemme myös seuraavia:
Laajennamme interventioita useampiin kriisissä oleviin ihmisiin.
Vaikka alkuperäiset lieventämistoimenpiteemme painottivat akuuttia itsetuhoa, on myös ihmisiä, jotka kokevat muunlaisia henkistä kärsimystä. Esimerkiksi joku saattaa innokkaasti kertoa mallille uskovansa voivansa ajaa 24/7, koska hän kokee olevansa voittamaton oltuaan nukkumatta kaksi yötä. Nykyään ChatGPT ei ehkä tunnista tätä vaaralliseksi tai vihjaa pelaamisesta ja – uteliaasti tutkimalla – se voisi hienovaraisesti vahvistaa sitä.
Työskentelemme GPT‑5‑päivityksen parissa, joka saa ChatGPT:n palauttamaan henkilön todellisuuteen ja estää tilanteen eskaloitumisen. Tässä esimerkissä malli selittäisi, että unenpuute on vaarallista ja suosittelisi lepoa ennen mitään toimia.
Helpotamme hätäpalveluihin pääsyä ja avun saamista asiantuntijoilta.
Nykyään, kun ihmiset ilmaisevat aikomuksen vahingoittaa itseään, kannustamme heitä hakemaan apua ja ohjaamme heidät tosielämän resursseihin. Olemme aloittaneet resurssien lokalisoinnin Yhdysvalloissa ja Euroopassa, ja aiomme laajentaa muille markkinoille maailmanlaajuisesti. Parannamme myös esteettömyyttä yhdellä napsautuksella käytettävällä hätäpalvelulla.
Selvitämme, miten voimme puuttua tilanteeseen aikaisemmin ja yhdistää ihmiset pätevöityneiden terapeuttien kanssa ennen kuin he ovat akuutissa kriisissä. Se tarkoittaa muita keinoja kuin vain kriisipuhelinlinjoja ja sen pohtimista, miten voimme rakentaa verkoston pätevöityneitä ammattilaisia, joihin ihmiset voivat ottaa suoraan yhteyttä ChatGPT:n kautta. Siinä onnistuminen vaatii aikaa ja huolellista työtä.
Otamme käyttöön yhteydet luotettaviin yhteyshenkilöihin.
Hätäpalveluiden lisäksi tutkimme tapoja helpottaa ihmisten yhteydenottoa lähimmäisiinsä. Se voi sisältää yhden napsautuksen viestejä tai hätätilanteessa puheluita tallennetuille henkilöille, ystäville tai perheenjäsenille ehdotetulla kielellä, jotta keskustelun aloittaminen olisi helpompaa.
Harkitsemme myös ominaisuuksia, joiden avulla vakavissa tapauksissa ihmiset voisivat valita ChatGPT:n ottavan yhteyttä nimettyyn yhteyshenkilöön heidän puolestaan.
Vahvistamme teini-ikäisten suojausta.
Aikaisemmin määrittelimme kaikille käyttäjillemme yhden ihanteellisen toimintamallin. ChatGPT:n kasvaessa aloimme lisätä lisäsuojauksia alle 18-vuotiaille käyttäjille. Jatkamme nuorten ainutlaatuisia kehitystarpeita huomioivien turvatoimien kehittämistä ja käyttöönottoa sekä vahvistamme suojakeinoja arkaluonteisen sisällön ja riskikäyttäytymisen suhteen.
Esittelemme pian myös lapsilukon, joka antaa vanhemmille mahdollisuuden saada enemmän tietoa siitä, miten heidän teini-ikäisensä käyttävät ChatGPT:tä, ja muokata sitä. Tutkimme myös mahdollisuutta, että teini-ikäiset (vanhempien valvonnassa) voisivat nimetä luotettavan yhteyshenkilön hätätilannetta varten. Tällä tavoin akuutin ahdingon hetkinä ChatGPT voi tehdä enemmän kuin vain ohjata resursseihin: se voi auttaa teini-ikäisiä saamaan yhteyden suoraan henkilöön, joka voi puuttua asiaan.
Olemme täysin tietoisia siitä, että turvatoimet ovat vahvimmillaan silloin, kun jokainen osa toimii tarkoitetulla tavalla. Jatkamme kehittämistä asiantuntijoiden ohjaamina ja vastuullisesti työkalujamme käyttäviä ihmisiä kohtaan. Toivomme, että muut liittyvät seuraamme varmistamaan, että tämä teknologia suojelee ihmisiä silloin, kun he ovat haavoittuvimpia.


