Негізгі мазмұнға өту
OpenAI

2025 ж. 26 тамыз

ҚауіпсіздікӨнім

Адамдарға ең қажет сәтте көмектесу

Жүктелуде…

ChatGPT қолданылуы бүкіл әлемде өскен сайын, адамдар оны тек іздеу, код жазу және мәтін жазу үшін ғана емес, сонымен бірге өмірлік кеңес(жаңа терезеде ашылады), коучинг(жаңа терезеде ашылады) және қолдау(жаңа терезеде ашылады) қамтылатын өте жеке шешімдер үшін де қолдана бастағанын көрдік.

Осындай ауқымда біз кейде психикалық және эмоциялық тұрғыдан қатты күйзелісте жүрген адамдарды кездестіреміз. Біз бұл туралы бірнеше апта бұрын жазған едік және келесі ірі жаңартуымыздан кейін толығырақ бөлісуді жоспарлағанбыз. Алайда, жақында ChatGPT‑ті өткір дағдарыс кезінде пайдаланған адамдарға қатысты жан ауыртатын жағдайлар бізге қатты әсер етті, сондықтан қазір-ақ көбірек айтып беру маңызды деп санаймыз.

Біздің мақсатымыз — құралдарымыз адамдарға барынша пайдалы болуы. Соның бір бөлігі ретінде біз сарапшылардың пікіріне сүйене отырып, модельдеріміздің психикалық және эмоциялық күйзеліс белгілерін қалай танитынын, қалай жауап беретінін және адамдарды көмекке қалай бағыттайтынын жетілдіруді жалғастырып келеміз.

Әлем осы жаңа технологияға бейімделіп жатқанда, біз оған ең мұқтаж адамдарға көмектесу үшін терең жауапкершілік сезінеміз. Біз ChatGPT не істеуге арналғанын, жүйелерімізді қай тұста жақсартуға болатынын және болашақта қандай жұмыстарды жоспарлап отырғанымызды түсіндіргіміз келеді.

ChatGPT не істеуге арналған

Біздің мақсатымыз — адамдардың назарын ұстап тұру емес. Табысты уақыт ұзақтығымен не басулар санымен өлшеудің орнына, біз шын мәнінде пайдалы болуға көбірек мән береміз. Әңгіме барысында біреудің осал жағдайда екені және қауіп төнуі мүмкін екені байқалса, біз ChatGPT‑ке бірнеше қабаттан тұратын қорғаныс тетіктерін енгіздік.

Танып, жанашырлықпен жауап беру.

2023 жылдың басынан бері модельдеріміз өзін-өзі жарақаттауға қатысты нұсқаулық бермеуге және қолдаушы, жанашыр тілге көшуге үйретілді. Мысалы, егер біреу өзіне зиян келтіргісі келетінін жазса, ChatGPT бұған көндікпеуге, оның сезімін мойындауға және оны көмекке бағыттауға үйретілген.

Бұған қоса, біздің қорғанысты тереңдету тәсілімізге сай, классификаторларымыз анықтаған модель қауіпсіздігі жаттығуына қайшы жауаптар автоматты түрде бұғатталады, ал кәмелетке толмағандар мен жүйеге кірмеген қолдану үшін қорғаныс күштірек болады. Өзін-өзі жарақаттау бейнеленген сурет нәтижелері де барлығы үшін бұғатталады, ал кәмелетке толмағандар үшін қорғаныс одан да күштірек.

Өте ұзақ сессиялар кезінде ChatGPT адамдарға үзіліс жасауды еске салады.

Адамдарды шынайы өмірдегі ресурстарға бағыттау.

Егер біреу суицидтік ниетін білдірсе, ChatGPT адамдарды кәсіби көмекке жүгінуге бағыттауға үйретілген. АҚШ-та ChatGPT адамдарды 988-ге (суицид және дағдарыс бойынша сенім желісі), Ұлыбританияда Samaritans қызметіне, ал басқа жерлерде findahelpline.com(жаңа терезеде ашылады) сайтына жібереді. Бұл логика модель мінез-құлқына енгізілген.

Біз 30-дан астам елдегі 90-нан астам дәрігермен — психиатрлармен, педиатрлармен және жалпы практика дәрігерлерімен — тығыз жұмыс істеп жатырмыз, сондай-ақ тәсіліміз соңғы зерттеулер мен үздік тәжірибелерге сай болуын қамтамасыз ету үшін психикалық денсаулық, жастардың дамуы және адам-компьютер өзара әрекеттесуі салаларындағы сарапшылардан кеңесші топ құрып жатырмыз.

Басқаларға физикалық зиян келтіру қаупін адам тексеруіне шығару.

Пайдаланушылардың басқаларға зиян келтіруді жоспарлап жатқанын анықтағанда, біз олардың әңгімелерін арнайы арналарға жібереміз, онда оларды пайдалану саясаттарымыз бойынша оқытылған және әрекет етуге, соның ішінде аккаунттарды бұғаттауға уәкілетті шағын топ қарайды. Егер адам шолушылары белгілі бір жағдайда басқаларға ауыр физикалық зиян келтірудің жақын қаупі бар деп шешсе, біз оны құқық қорғау органдарына жібере аламыз. Қазір біз адамдардың құпиялылығын құрметтеу үшін, ChatGPT өзара әрекеттесулерінің ерекше жеке сипатын ескере отырып, өзін-өзі жарақаттау жағдайларын құқық қорғау органдарына жіберіп жатқан жоқпыз.

Біз модельдеріміздің сезімтал өзара әрекеттесулерде қалай жауап беретінін үздіксіз жақсартып келеміз және қазір эмоциялық тәуелділік, психикалық денсаулық төтенше жағдайлары және жағымпаздықты қоса алғанда, бірнеше бағыт бойынша мақсатты қауіпсіздік жақсартуларымен жұмыс істеп жатырмыз.

Тамызда біз ChatGPT‑ті әдепкі түрде жұмыс істететін модель ретінде GPT‑5‑ті іске қостық. Жалпы алғанда, GPT‑5 эмоциялық тәуелділіктің зиянды деңгейлерінен аулақ болу, жағымпаздықты азайту және 4o-мен салыстырғанда психикалық денсаулық төтенше жағдайларында мінсіз емес модель жауаптарының жиілігін 25%-дан астам төмендету сияқты салаларда елеулі жақсартулар көрсетті. GPT‑5 сондай-ақ қауіпсіз аяқтаулар деп аталатын жаңа қауіпсіздік жаттықтыру әдісіне сүйенеді, ол модельді қауіпсіздік шектерінен шықпай, барынша пайдалы болуға үйретеді. Бұл қауіпті болуы мүмкін егжей-тегжейдің орнына ішінара немесе жоғары деңгейлі жауап беруді білдіруі мүмкін.

Жүйелеріміз қай жерде жеткіліксіз болуы мүмкін, неге және оны қалай түзетіп жатырмыз

Осы қорғаныс тетіктеріне қарамастан, жүйелеріміз сезімтал жағдайларда ойдағыдай жұмыс істемеген сәттер болды. Міне, біз жақсартуға тырысып жатқан кейбір нәрселер.

Ұзақ әңгімелердегі қорғаныс тетіктерін күшейту.

Біздің қорғаныс тетіктері жиі кездесетін қысқа алмасуларда анағұрлым сенімді жұмыс істейді. Уақыт өте келе біз бұл қорғаныс тетіктері ұзақ өзара әрекеттесулерде кейде азырақ сенімді болатынын түсіндік: диалог ұзарған сайын, модельдің қауіпсіздікке қатысты жаттығуының кейбір бөліктері әлсіреуі мүмкін. Мысалы, біреу алғаш рет ниетін айтқанда ChatGPT суицидке қарсы сенім желісін дұрыс көрсетуі мүмкін, бірақ ұзақ уақыт бойы көп хабарламадан кейін ақыры біздің қорғаныс тетіктерімізге қайшы келетін жауап ұсынуы ықтимал. Дәл осындай іркілістің алдын алумен біз қазір айналысып жатырмыз. Біз бұл жұмсарту шараларын ұзақ әңгімелерде де сенімді болып қалатындай етіп күшейтіп жатырмыз және бірнеше әңгіме бойына берік мінез-құлықты қамтамасыз ету жолдарын зерттеп жатырмыз. Осылайша, егер біреу бір чатта суицидтік ниетін білдіріп, кейін басқа чат бастаса, модель әлі де дұрыс жауап бере алады.

Контентті қалай бұғаттайтынымызды жетілдіру.

Бұғатталуы тиіс контент бұғатталмай қалған кейбір жағдайларды көрдік. Мұндай олқылықтар әдетте классификатор көріп тұрған нәрсенің ауырлығын жеткіліксіз бағалағандықтан болады. Біз қорғаныс тетіктері тиіс кезде іске қосылуы үшін сол шектерді реттеп жатырмыз.

Біздің басты басымдығымыз — ChatGPT қиын сәтті одан сайын нашарлатпауын қамтамасыз ету.

Болашаққа не жоспарлап отырмыз

Жұмыс тек жоғарыда айтылғандарды түзетумен тоқтамайды. Біз сондай-ақ мыналарды жоспарлап отырмыз: 

Дағдарыстағы көбірек адамға араласу шараларын кеңейту.

Бастапқы жұмсарту шараларымыз өткір өзін-өзі жарақаттауға басымдық бергенімен, кейбір адамдар психикалық күйзелістің басқа түрлерін бастан кешіреді. Мысалы, біреу екі түн ұйықтамағаннан кейін өзін жеңілмеспін деп түсінгені үшін тәулік бойы көлік жүргізе алатынына сенетінін модельге аса құлшыныспен айтуы мүмкін. Бүгінде ChatGPT мұны қауіпті жағдай ретінде танымауы немесе астарын түсінбеуі мүмкін және қызығушылықпен зерттей отырып, оны байқатпай күшейтіп жіберуі ықтимал.

Біз GPT‑5 үшін ChatGPT‑ті адамның шындықты сезінуін негіздеу арқылы жағдайды ушықтырмауға итермелейтін жаңартумен жұмыс істеп жатырмыз. Бұл мысалда ол ұйқының қанбауы қауіпті екенін түсіндіріп, қандай да бір әрекетке дейін демалуды ұсынар еді.

Төтенше қызметтерге жүгінуді және сарапшылардан көмек алуды одан да жеңілдету.

Қазір адамдар өзіне зиян келтіру ниетін білдіргенде, біз оларды көмек сұрауға ынталандырамыз және шынайы өмірдегі ресурстарға бағыттаймыз. Біз АҚШ пен Еуропада ресурстарды жергіліктендіруді бастадық және оны басқа жаһандық нарықтарға кеңейтуді жоспарлап отырмыз. Сондай-ақ төтенше қызметтерге бір рет басып қол жеткізу арқылы қолжетімділікті арттырамыз.

Біз адамдар өткір дағдарысқа түспей тұрып ертерек араласып, оларды сертификатталған терапевттермен байланыстыру жолдарын зерттеп жатырмыз. Бұл дағдарыс желілерінен асып түсіп, адамдар ChatGPT арқылы тікелей хабарласа алатын лицензияланған мамандар желісін қалай құруға болатынын қарастыруды білдіреді. Мұны дұрыс жасау үшін уақыт пен мұқият жұмыс қажет.

Сенімді байланыстармен қосылуды іске қосу.

Төтенше қызметтерден бөлек, біз адамдарға өздеріне ең жақын жандармен байланысуды жеңілдету жолдарын зерттеп жатырмыз. Бұған әңгімені бастауды үрейлі етпеу үшін ұсынылатын мәтіндермен бірге сақталған төтенше байланыстарға, достарға немесе отбасы мүшелеріне бір рет басып хабарлама жіберу не қоңырау шалу кіруі мүмкін.

Сондай-ақ біз ауыр жағдайларда ChatGPT‑ке олардың атынан белгіленген байланыс адамына шығуға мүмкіндік беретін, адамдар өз еркімен қоса алатын функцияларды да қарастырып жатырмыз.

Жасөспірімдерге арналған қорғанысты күшейту.

Тарихи тұрғыдан біз барлық пайдаланушыларымыз үшін модельдің бір идеалды мінез-құлқын белгілеген едік; ChatGPT өскен сайын, пайдаланушының 18 жасқа толмағанын білген кезде қосымша қорғаныс қоса бастадық. Біз жасөспірімдердің дамуындағы ерекше қажеттіліктерді танитын, сезімтал контент пен қауіпті мінез-құлыққа қатысты қоршауы күштірек қорғаныс тетіктерін әзірлеуді және енгізуді жалғастырып жатырмыз.

Сондай-ақ жақын арада ата-ана бақылауы функцияларын енгіземіз, олар ата-аналарға жасөспірімдерінің ChatGPT‑ті қалай пайдаланатынын тереңірек түсінуге және соны қалыптастыруға мүмкіндік береді. Біз сондай-ақ жасөспірімдерге (ата-ананың қадағалауымен) сенімді төтенше байланыс адамын белгілеуге мүмкіндік беруді зерттеп жатырмыз. Осылайша, өткір күйзеліс сәттерінде ChatGPT ресурстарды көрсетумен ғана шектелмей, жасөспірімдерді араласа алатын адаммен тікелей байланыстыруға көмектесе алады.

Қорғаныс тетіктері әрбір элемент ойдағыдай жұмыс істегенде ғана ең мықты болатынын біз терең түсінеміз. Біз сарапшылардың жетекшілігімен және құралдарымызды пайдаланатын адамдар алдындағы жауапкершілікке негізделе отырып, жетілдіруді жалғастырамыз және бұл технология адамдарды ең осал сәттерінде қорғайтынына көз жеткізуге көмектесуде басқалар да бізге қосылады деп үміттенеміз.