Jak zapewnić pomoc, kiedy jest najbardziej potrzebna
Wraz z rosnącą popularnością ChatGPT na całym świecie widzimy, jak ludzie używają go nie tylko do szukania informacji, programowania i tworzenia tekstów, ale też traktują to narzędzie jako pomoc w trudnych sytuacjach, w szczególności przy podejmowaniu życiowych decyzji(otwiera nowe okno), kształtowaniu postaw(otwiera nowe okno) i szukaniu wsparcia(otwiera nowe okno).
Z uwagi na ogromną skalę działalności, wśród naszych użytkowników zdarzają się też osoby, które odczuwają silne cierpienia psychiczne i emocjonalne. Pisaliśmy już o tym kilka tygodni temu i chcieliśmy wrócić do tematu po naszej kolejnej dużej aktualizacji. Jednak bardzo poruszyły nas ostatnie bolesne przypadki osób korzystających z ChatGPT w sytuacji poważnego kryzysu psychicznego, więc uznaliśmy, że z tą sprawą nie wolno zwlekać.
Chcemy, aby nasze narzędzia były jak najbardziej użyteczne. Nieustannie ulepszamy nasze modele przy współpracy z ekspertami, aby mogły skuteczniej rozpoznawać oznaki cierpienia psychicznego i emocjonalnego, reagować na nie i zapewnić potrzebującym należytą troskę.
Podczas gdy świat wciąż uczy się korzystania z tej nowej technologii, my czujemy ogromną odpowiedzialność za tych, którzy najbardziej wymagają wsparcia. Chcielibyśmy wyjaśnić, jak ChatGPT powinien działać według założeń, w jaki sposób nasze systemy można jeszcze ulepszyć oraz co planujemy na przyszłość.
Naszym celem nie jest przykuwanie uwagi użytkowników. Nie mierzymy sukcesu czasem spędzonym na stronie ani liczbą kliknięć, ale raczej tym, czy nasze usługi są naprawdę przydatne. Jeśli z konwersacji wynika, że dana osoba jest w kryzysie psychicznym i grozi jej niebezpieczeństwo, ChatGPT uruchamia szereg wielopoziomowych zabezpieczeń.
Okazywanie zrozumienia i empatii
Od początku 2023 roku nasze modele są trenowane, aby nie udzielały porad technicznych w sprawie samookaleczania i komunikowały się w sposób wspierający i empatyczny. Jeśli na przykład ktoś napisze, że chce zrobić sobie krzywdę, ChatGPT według założeń nie powinien udzielić odpowiedzi, lecz raczej okazać zrozumienie dla uczuć tej osoby i skierować ją tam, gdzie można uzyskać pomoc.
Ponadto, zgodnie z naszą koncepcją zabezpieczeń wielowarstwowych, odpowiedzi niezgodne z treningiem naszych modeli w zakresie bezpieczeństwa — rozpoznane przez nasze klasyfikatory — są automatycznie blokowane, przy czym ochrona działa intensywniej wobec osób niepełnoletnich i niezalogowanych Generowanie obrazów przedstawiających samookaleczenie jest również blokowane w przypadku wszystkich użytkowników, a osoby niepełnoletnie są objęte jeszcze silniejszą ochroną.
Podczas bardzo długich sesji ChatGPT zachęca użytkowników do przerw.
Kierowanie użytkowników do źródeł wsparcia w prawdziwym świecie
Jeśli ktoś wyraża zamiar popełnienia samobójstwa, ChatGPT powinien skierować taką osobę tam, gdzie można uzyskać fachowe wsparcie psychiczne. W Stanach Zjednoczonych ChatGPT proponuje telefon na numer 988 (linia dla osób z myślami samobójczymi i w kryzysie), w Wielkiej Brytanii prosi o kontakt z organizacją Samaritans, a w innych krajach kieruje na stronę findahelpline.com(otwiera nowe okno). Takie działanie jest wbudowane w model.
Ściśle współpracujemy z ponad 90 lekarzami z ponad 30 krajów — są wśród nich psychiatrzy, pediatrzy i lekarze pierwszego kontaktu — a także tworzymy grupę doradczą złożoną z ekspertów z dziedziny zdrowia psychicznego, dojrzewania i interakcji człowiek-komputer, aby mieć pewność, że nasze metody działania uwzględniają wyniki najnowszych badań i zalecane praktyki.
Kierowanie podejrzeń o zamiar wyrządzenia krzywdy fizycznej innym osobom do weryfikacji przez człowieka
W razie wykrycia użytkowników planujących wyrządzenie krzywdy innym osobom przekierowujemy ich konwersacje do weryfikacji przez niewielki zespół wyspecjalizowany w zakresie naszych zasad użytkowania. Jego członkowie są upoważnieni do podejmowania odpowiednich działań, w tym do blokowania kont. Jeśli weryfikatorzy stwierdzą bezpośrednie zagrożenie dla zdrowia i życia innych osób, mogą przekazać konwersację organom ścigania. Obecnie nie przekazujemy organom ścigania spraw samookaleczeń ze względu na poszanowanie prywatności użytkowników w kontekście wyjątkowo poufnego charakteru interakcji z ChatGPT.
Nieustannie ulepszamy sposób reagowania naszych modeli podczas wrażliwych interakcji, a obecnie pracujemy nad specjalnymi ulepszeniami bezpieczeństwa w kilku obszarach, zwłaszcza dotyczących problemów uzależnienia emocjonalnego, kryzysów psychicznych oraz manipulacji psychicznej.
W sierpniu wdrożyliśmy GPT‑5 jako domyślny model w ChatGPT. Mówiąc ogólnie, model GPT‑5 wykazuje istotną poprawę, między innymi w zakresie unikania szkodliwego uzależnienia emocjonalnego i manipulacji psychicznej, a także zmniejszenie o ponad 25% w porównaniu z modelem GPT‑4o częstotliwości nieoptymalnych odpowiedzi w kontekście kryzysu psychicznego. Model GPT‑5 został również wytrenowany przy użyciu nowej, bezpiecznej metody treningowej o nazwie bezpieczne odpowiedzi, która uczy model jak najbardziej pomocnych zachowań w wyznaczonych granicach bezpieczeństwa. Może to oznaczać preferowanie odpowiedzi częściowych lub ogólnikowych zamiast takich, które są szczegółowe, ale mogą być niebezpieczne.
Mimo tych zabezpieczeń w krytycznych sytuacjach nasze systemy nie zawsze działają zgodnie z oczekiwaniami. Oto kilka obszarów, nad którymi nadal pracujemy.
Poprawa bezpieczeństwa podczas długich konwersacji
Nasze zabezpieczenia działają najlepiej w przypadku krótkich, typowych rozmów. Z czasem okazało się jednak, że potrafią być zawodne w przypadku długich konwersacji: wraz z wydłużaniem się rozmowy niektóre efekty szkolenia modelu mogą stracić skuteczność. ChatGPT może na przykład poprawnie zaproponować numer telefonu zaufania dla osób z myślami samobójczymi, gdy ktoś o nich wspomni po raz pierwszy, ale już po wymianie wielu komunikatów przez dłuższy czas może udzielać odpowiedzi sprzecznych z wyuczonymi zabezpieczeniami. Pracujemy usilnie nad rozwiązaniem tego problemu. Usprawniamy zabezpieczenia, aby były nadal niezawodne w długich konwersacjach, i staramy się podnieść ich niezawodność, gdy interakcja obejmuje szereg kolejnych rozmów. Dzięki temu, jeśli ktoś wyrazi zamiar samobójstwa w jednym czacie, a później rozpocznie kolejny, model nadal będzie w stanie odpowiednio reagować.
Poprawa metod blokowania treści
Zdarzały się sytuacje, w których pewne treści nie zostały zablokowane, mimo że powinny. Jest tak zazwyczaj, gdy klasyfikator nieprawidłowo oceni poziom zagrożenia związany z daną treścią. Dostosowujemy progi reakcji, aby zabezpieczenia działały bardziej niezawodnie.
Najważniejsze jest dla nas to, by ChatGPT nie pogarszał sytuacji, które i tak są trudne.
Nasza praca nie skończy się na rozwiązaniu powyższych problemów. Oto nasze plany:
Rozszerzanie interwencji na inne osoby w kryzysie
Chociaż w pierwszej kolejności skupiliśmy się na osobach zamierzających zrobić sobie krzywdę, są też inne formy cierpienia psychicznego. Na przykład ktoś może entuzjastycznie oznajmić, że potrafi prowadzić samochód przez całą dobę, bo po dwóch nocach bez snu nic go już nie złamie. Obecnie ChatGPT może nie uznać tego stwierdzenia za ryzykowne albo zinterpretować je jako żart, po czym, zadając dociekliwe pytania, może subtelnie wzmocnić to przekonanie.
Pracujemy nad aktualizacją modelu GPT‑5, dzięki której ChatGPT będzie działać jako trzeźwy głos rozsądku. W tym przykładzie wyjaśniłby, że brak snu jest niebezpieczny i zaleciłby odpoczynek przed podjęciem jakichkolwiek działań.
Jeszcze łatwiejszy kontakt ze służbami ratunkowymi i pomoc od specjalistów
Obecnie użytkownicy deklarujący zamiar wyrządzenia sobie krzywdy są zachęcani do szukania pomocy i kierowani do źródeł wsparcia w prawdziwym świecie. Rozpoczęliśmy poszukiwanie źródeł wsparcia w Stanach Zjednoczonych i w Europie, planujemy rozszerzyć te działania na inne rejony świata. Zwiększymy również łatwość dostępu do wsparcia, umożliwiając kontakt ze służbami ratunkowymi jednym kliknięciem.
Badamy możliwości wcześniejszego interweniowania i kierowania osób do wykwalifikowanych terapeutów, zanim ich stan się zaostrzy. Oznacza to krok dalej poza podsuwanie numerów infolinii: rozważamy możliwości stworzenia sieci licencjonowanych specjalistów, z którymi użytkownicy mogliby kontaktować się bezpośrednio przez ChatGPT. Rzecz jasna, będzie to wymagać czasu i starannych przygotowań.
Kontakt z bliskimi osobami
Oprócz proponowania pomocy zewnętrznej badamy także sposoby, jak ułatwić użytkownikom kontakt z najbliższymi. Mogą to być wiadomości lub połączenia telefoniczne jednym kliknięciem do zapisanych kontaktów alarmowych, przyjaciół lub członków rodziny, wraz z sugerowanymi zwrotami, które ułatwią rozpoczęcie konwersacji.
Rozważamy też funkcje, które pozwoliłyby użytkownikom wyrazić zgodę na to, że w poważnych przypadkach ChatGPT skontaktuje się w ich imieniu z wybraną osobą.
Lepsza ochrona nastolatków
W przeszłości zwykle wybieraliśmy jeden idealny sposób zachowania modelu dla wszystkich naszych użytkowników. Wraz z rozwojem ChatGPT zaczęliśmy wprowadzać dodatkowe zabezpieczenia dla osób niepełnoletnich. Nadal opracowujemy i wdrażamy zabezpieczenia, które uwzględniają specyficzne potrzeby rozwojowe nastolatków i zapewniają podwyższoną ochronę w odniesieniu do treści wrażliwych i ryzykownych zachowań.
Wkrótce wprowadzimy również funkcję kontroli rodzicielskiej, która pozwoli rodzicom zyskać większą świadomość i kontrolę nad tym, jak ich nastoletnie dzieci korzystają z ChatGPT. Rozważamy również umożliwienie nastolatkom (pod nadzorem rodziców) wyznaczenie zaufanej osoby kontaktowej w nagłych przypadkach. Dzięki temu w sytuacji poważnego kryzysu ChatGPT będzie mógł nie tylko wskazać odpowiednie źródła wsparcia, ale także ułatwić nastolatkom kontakt z kimś, komu ufają.
Dobrze wiemy, że na skuteczność zabezpieczeń składa się cały szereg elementów. Będziemy stale wprowadzać usprawnienia z pomocą ekspertów i w poczuciu odpowiedzialności wobec osób korzystających z naszych narzędzi. Mamy nadzieję, że dołączą do nas inni i wspólnie doprowadzimy tego, by technologia AI chroniła osoby w najtrudniejszej sytuacji.


