Помоћ људима када им је најпотребнија
Како је употреба ChatGPT‑а расла широм света, видели смо да му се људи окрећу не само за претрагу, програмирање и писање — већ и за дубоко личне одлуке које укључују животне савете(отвара се у новом прозору), коучинг(отвара се у новом прозору) и подршку(отвара се у новом прозору).
У овом обиму понекад наилазимо на људе у озбиљној менталној и емоционалној кризи. О томе смо писали пре неколико недеља и планирали смо да поделимо више након нашег следећег великог ажурирања. Међутим, недавни срцепарајући случајеви људи који су користили ChatGPT усред акутних криза тешко нас погађају и верујемо да је важно да сада поделимо више.
Наш циљ је да наши алати буду што кориснији људима — и као део тога, настављамо да унапређујемо начин на који наши модели препознају и реагују на знаке менталне и емоционалне кризе и повезују људе са негом, уз смернице стручњака.
Док се свет прилагођава овој новој технологији, осећамо дубоку одговорност да помогнемо онима којима је то најпотребније. Желимо да објаснимо за шта је ChatGPT осмишљен, где наши системи могу да се побољшају и какав рад планирамо у будућности.
Наш циљ није да задржавамо пажњу људи. Уместо да успех меримо временом проведеним на платформи или бројем кликова, више нам је стало до тога да будемо истински корисни. Када разговор указује на то да је неко рањив и да може бити у ризику, у ChatGPT смо уградили слојевит скуп заштитних мера.
Препознавање и реаговање са емпатијом.
Још од почетка 2023. године, наши модели су обучавани да не пружају упутства за самоповређивање и да пређу на подржавајући, емпатичан језик. На пример, ако неко напише да жели да повреди себе, ChatGPT је обучен да то не подржи, већ да призна њихова осећања и усмери их ка помоћи.
Поред тога, у складу са нашим приступом вишеслојне одбране, одговори који иду против безбедносне обуке наших модела — како их идентификују наши класификатори — аутоматски се блокирају, уз јачу заштиту за малолетнике и коришћење без пријаве. Генерисање слика са самоповређивањем такође је блокирано за све, уз јачу заштиту за малолетнике.
Током веома дугих сесија, ChatGPT подсећа људе да направе паузу.
Упућивање људи на ресурсе из стварног света.
Ако неко изрази суицидалну намеру, ChatGPT је обучен да упути људе да потраже стручну помоћ. У САД, ChatGPT упућује људе на 988 (линија за самоубиство и кризе), у УК на Samaritans, а другде на findahelpline.com(отвара се у новом прозору). Ова логика је уграђена у понашање модела.
Блиско сарађујемо са више од 90 лекара у више од 30 земаља — психијатрима, педијатрима и лекарима опште праксе — и окупљамо саветодавну групу стручњака за ментално здравље, развој младих и интеракцију човека и рачунара како бисмо обезбедили да наш приступ одражава најновија истраживања и најбоље праксе.
Ескалација ризика од физичке повреде других на људску ревизију.
Када откријемо кориснике који планирају да повреде друге, њихове разговоре усмеравамо у специјализоване токове где их прегледа мали тим обучен за наше политике коришћења и овлашћен да предузме мере, укључујући забрану налога. Ако људски рецензенти утврде да случај укључује непосредну претњу од озбиљне физичке повреде других, можемо га упутити органима за спровођење закона. Тренутно не упућујемо случајеве самоповређивања органима за спровођење закона како бисмо поштовали приватност људи, имајући у виду јединствено приватну природу интеракција са ChatGPT‑ом.
Непрестано унапређујемо начин на који наши модели реагују у осетљивим интеракцијама и тренутно радимо на циљаним безбедносним побољшањима у неколико области, укључујући емоционално ослањање, хитна стања у менталном здрављу и сикофантију.
У августу смо лансирали GPT‑5 као подразумевани модел који покреће ChatGPT. У целини, GPT‑5 је показао значајна побољшања у областима као што су избегавање нездравог нивоа емоционалног ослањања, смањење сикофантије и смањење учесталости неидеалних одговора модела у хитним случајевима менталног здравља за више од 25% у поређењу са 4o. GPT‑5 се такође надовезује на нови метод безбедносне обуке под називом safe completions, који учи модел да буде што кориснији, а да притом остане унутар безбедносних ограничења. То може значити давање делимичног или општег одговора уместо детаља који би могли бити небезбедни.
Чак и са овим заштитним мерама, било је тренутака када се наши системи у осетљивим ситуацијама нису понашали онако како је предвиђено. Ево неких ствари које радимо да побољшамо.
Јачање заштитних мера у дугим разговорима.
Наше заштитне мере поузданије функционишу у уобичајеним, кратким разменама. Временом смо научили да ове мере понекад могу бити мање поуздане у дугим интеракцијама: како размена постаје дужа, делови безбедносне обуке модела могу да ослабе. На пример, ChatGPT може исправно упутити на линију за превенцију самоубиства када неко први пут помене намеру, али после много порука током дужег периода, могао би на крају да понуди одговор који иде против наших заштитних мера. Управо ову врсту пропуста настојимо да спречимо. Јачамо ова ублажавања како би остала поуздана у дугим разговорима и истражујемо начине да обезбедимо робусно понашање кроз више разговора. Тако, ако неко у једном ћаскању изрази суицидалну намеру, а касније започне друго, модел и даље може да реагује на одговарајући начин.
Усавршавање начина на који блокирамо садржај.
Видели смо неке случајеве у којима садржај који је требало да буде блокиран није био блокиран. Ови пропусти се обично дешавају зато што класификатор потцени озбиљност онога што види. Подешавамо те прагове како би се заштите активирале онда када треба.
Наш главни приоритет је да осигурамо да ChatGPT не погорша тежак тренутак.
Рад се не завршава исправљањем наведеног. Такође планирамо да:
Проширимо интервенције на већи број људи у кризи.
Иако су наше почетне мере ублажавања давале приоритет акутном самоповређивању, неки људи доживљавају и друге облике менталне кризе. На пример, неко би могао одушевљено да каже моделу да верује да може да вози 24/7 јер је схватио да је неуништив након што две ноћи није спавао. Данас ChatGPT можда неће препознати ово као опасно нити закључити да се ради о заносу и — радозналим истраживањем — могао би га суптилно ојачати.
Радимо на ажурирању GPT‑5 које ће довести до тога да ChatGPT смири ситуацију тако што ће особу утемељити у стварности. У овом примеру, објаснио би да је недостатак сна опасан и препоручио одмор пре било какве акције.
Учинимо још лакшим приступ хитним службама и добијање помоћи од стручњака.
Данас, када људи изразе намеру да повреде себе, охрабрујемо их да потраже помоћ и упућујемо их на ресурсе из стварног света. Почели смо да локализујемо ресурсе у САД и Европи и планирамо да се проширимо на друга светска тржишта. Такође ћемо повећати доступност приступом хитним службама једним кликом.
Истражујемо како да интервенишемо раније и повежемо људе са сертификованим терапеутима пре него што дођу у акутну кризу. То значи да идемо даље од кризних телефонских линија и разматрамо како бисмо могли да изградимо мрежу лиценцираних стручњака до којих би људи могли директно да дођу преко ChatGPT‑а. За ово ће бити потребно време и пажљив рад да бисмо то урадили како треба.
Омогућимо повезивање са контактима од поверења.
Поред хитних служби, истражујемо начине да људима олакшамо да се обрате онима који су им најближи. То би могло да укључи поруке или позиве једним кликом ка сачуваним хитним контактима, пријатељима или члановима породице, уз предложени текст који почетак разговора чини мање застрашујућим.
Такође разматрамо функције које би омогућиле људима да се опредељивањем сагласе да ChatGPT у тешким случајевима контактира одређену особу у њихово име.
Ојачамо заштиту за тинејџере.
Историјски гледано, дефинисали смо једно идеално понашање модела за све наше кориснике; како је ChatGPT растао, почели смо да додајемо додатне заштите када знамо да је корисник млађи од 18 година. Настављамо да развијамо и уводимо заштитне мере које препознају јединствене развојне потребе тинејџера, са јачим ограничењима око осетљивог садржаја и ризичних понашања.
Такође ћемо ускоро увести родитељске контроле које родитељима дају опције да стекну више увида у то како њихови тинејџери користе ChatGPT и да то обликују. Такође истражујемо могућност да тинејџери (уз родитељски надзор) одреде контакт од поверења за хитне случајеве. Тако, у тренуцима акутне кризе, ChatGPT може да учини више од упућивања на ресурсе: може да помогне да се тинејџери директно повежу са неким ко може да притекне у помоћ.
Дубоко смо свесни да су заштитне мере најјаче када сваки елемент функционише онако како је предвиђено. Наставићемо да се унапређујемо, вођени стручњацима и утемељени у одговорности према људима који користе наше алате — и надамо се да ће нам се и други придружити како бисмо помогли да ова технологија штити људе када су најрањивији.


