გადადით მთავარ შინაარსზე
OpenAI

დახმარება ადამიანებს მაშინ, როცა ეს ყველაზე მეტად სჭირდებათ

იტვირთება…

როგორც ChatGPT‑ის გამოყენება მთელ მსოფლიოში გაიზარდა, დავინახეთ, რომ ადამიანები მას მიმართავენ არა მხოლოდ ძიებისთვის, კოდირებისა და წერისთვის — არამედ ძალიან პირადი გადაწყვეტილებებისთვისაც, რაც მოიცავს ცხოვრებისეულ რჩევებს(იხსნება ახალ ფანჯარაში), ქოუჩინგს(იხსნება ახალ ფანჯარაში) და მხარდაჭერას(იხსნება ახალ ფანჯარაში).

ამ მასშტაბზე ზოგჯერ ვაწყდებით ადამიანებს, რომლებიც მძიმე ფსიქიკურ და ემოციურ კრიზისს განიცდიან. ჩვენ ამის შესახებ რამდენიმე კვირის წინ დავწერეთ და ვგეგმავდით, მეტი გაგვეზიარებინა ჩვენი შემდეგი დიდი განახლების შემდეგ. თუმცა, ბოლო დროის გულდასაწყვეტი შემთხვევები, როცა ადამიანები მწვავე კრიზისის დროს ChatGPT‑ს იყენებდნენ, ჩვენზე ძლიერად მოქმედებს და გვჯერა, რომ მნიშვნელოვანია მეტი უკვე ახლა გავაზიაროთ.

ჩვენი მიზანია, ჩვენი ინსტრუმენტები ადამიანებისთვის მაქსიმალურად სასარგებლო იყოს — და ამის ფარგლებში ვაგრძელებთ გაუმჯობესებას, თუ როგორ ამოიცნობენ და რეაგირებენ ჩვენი მოდელები ფსიქიკური და ემოციური სტრესის ნიშნებზე და როგორ აკავშირებენ ადამიანებს ზრუნვასთან, ექსპერტების რჩევების საფუძველზე.

რადგან მსოფლიო ამ ახალ ტექნოლოგიას ერგება, ღრმა პასუხისმგებლობას ვგრძნობთ, დავეხმაროთ მათ, ვისაც ეს ყველაზე მეტად სჭირდება. გვინდა ავხსნათ, რისთვის არის შექმნილი ChatGPT, სად შეუძლია ჩვენს სისტემებს გაუმჯობესება და რა სამომავლო სამუშაოებს ვგეგმავთ.

რისთვის არის შექმნილი ChatGPT

ჩვენი მიზანი ადამიანების ყურადღების შეკავება არ არის. წარმატებას არ ვზომავთ დახარჯული დროით ან დაწკაპუნებებით; ჩვენთვის უფრო მნიშვნელოვანია, ვიყოთ ნამდვილად სასარგებლო. როცა საუბარი მიანიშნებს, რომ ვინმე მოწყვლადია და შესაძლოა საფრთხის ქვეშ იყოს, ChatGPT‑ში ჩაშენებული გვაქვს მრავალფენიანი დამცავი მექანიზმების სისტემა.

ამოცნობა და ემპათიით რეაგირება.

2023 წლის დასაწყისიდან ჩვენი მოდელები გაწვრთნილია ისე, რომ არ გასცენ თვითდაზიანების ინსტრუქციები და გადავიდნენ მხარდამჭერ, ემპათიურ ენაზე. მაგალითად, თუ ვინმე წერს, რომ საკუთარი თავის დაზიანება სურს, ChatGPT გაწვრთნილია ისე, რომ ამას არ დაეთანხმოს, სანაცვლოდ აღიაროს მისი გრძნობები და დახმარებისკენ მიმართოს.

ამასთან, ჩვენი სიღრმეში განლაგებული დაცვის მიდგომის შესაბამისად, პასუხები, რომლებიც ეწინააღმდეგება ჩვენი მოდელების უსაფრთხოების ტრენინგს — როგორც ამას ჩვენი კლასიფიკატორები ადგენენ — ავტომატურად იბლოკება, ხოლო არასრულწლოვნებისთვის და სისტემაში შეუსვლელი გამოყენებისთვის მოქმედებს უფრო ძლიერი დაცვა. თვითდაზიანების შემცველი გამოსახულებებიც ყველასთვის იბლოკება, არასრულწლოვნებისთვის კი უფრო ძლიერი დაცვით.

ძალიან ხანგრძლივი სესიების დროს ChatGPT ადამიანებს შესვენების აღებისკენ უბიძგებს.

ადამიანების რეალურ სამყაროში არსებულ რესურსებთან დაკავშირება.

თუ ვინმე სუიციდურ განზრახვას გამოხატავს, ChatGPT გაწვრთნილია ისე, რომ ადამიანებს პროფესიული დახმარების ძიებისკენ მიმართოს. აშშ-ში ChatGPT ადამიანებს 988-ზე (სუიციდისა და კრიზისის ცხელი ხაზი) მიმართავს, დიდ ბრიტანეთში — Samaritans-ზე, ხოლო სხვაგან — findahelpline.com(იხსნება ახალ ფანჯარაში)-ზე. ეს ლოგიკა მოდელის ქცევაშია ჩაშენებული.

ჩვენ მჭიდროდ ვმუშაობთ 90-ზე მეტ ექიმთან 30-ზე მეტ ქვეყანაში — ფსიქიატრებთან, პედიატრებთან და ზოგადი პრაქტიკის ექიმებთან — და ვქმნით მრჩეველთა ჯგუფს, რომელშიც იქნებიან ფსიქიკური ჯანმრთელობის, ახალგაზრდების განვითარების და ადამიანსა და კომპიუტერს შორის ურთიერთქმედების ექსპერტები, რათა ჩვენი მიდგომა უახლეს კვლევებსა და საუკეთესო პრაქტიკას ასახავდეს.

სხვებისთვის ფიზიკური ზიანის მიყენების რისკის გადაცემა ადამიანური განხილვისთვის.

როდესაც ვაფიქსირებთ მომხმარებლებს, რომლებიც სხვებისთვის ზიანის მიყენებას გეგმავენ, მათ საუბრებს სპეციალიზებულ არხებზე გადავამისამართებთ, სადაც ისინი განიხილება მცირე გუნდის მიერ, რომელიც გაწვრთნილია ჩვენი გამოყენების პოლიტიკებზე და უფლებამოსილია იმოქმედოს, მათ შორის აკაუნტების დაბლოკვით. თუ ადამიანური შემფასებლები დაადგენენ, რომ შემთხვევა სხვებისთვის მძიმე ფიზიკური ზიანის დაუყოვნებელ საფრთხეს მოიცავს, შესაძლოა ეს სამართალდამცავებს გადავცეთ. ამჟამად თვითდაზიანების შემთხვევებს სამართალდამცავებს არ გადავცემთ, რათა პატივი ვცეთ ადამიანების პირადობას ChatGPT‑თან ურთიერთობის განსაკუთრებით პირადი ბუნების გათვალისწინებით.

ჩვენ მუდმივად ვაუმჯობესებთ იმას, თუ როგორ რეაგირებენ ჩვენი მოდელები მგრძნობიარე ინტერაქციებზე, და ამჟამად ვმუშაობთ მიზნობრივ უსაფრთხოების გაუმჯობესებებზე რამდენიმე მიმართულებით, მათ შორის ემოციურ დამოკიდებულებაზე, ფსიქიკური ჯანმრთელობის საგანგებო შემთხვევებზე და მაამებლობაზე.

აგვისტოში GPT‑5 გავუშვით, როგორც ნაგულისხმევი მოდელი, რომელიც ChatGPT‑ს ამუშავებს. მთლიანობაში, GPT‑5‑მა აჩვენა მნიშვნელოვანი გაუმჯობესებები ისეთ სფეროებში, როგორიცაა ემოციური დამოკიდებულების არაჯანსაღი დონის თავიდან არიდება, მაამებლობის შემცირება და ფსიქიკური ჯანმრთელობის საგანგებო შემთხვევებში მოდელის არაიდეალური პასუხების გავრცელების 25%-ზე მეტით შემცირება 4o-სთან შედარებით. GPT‑5 ასევე ეფუძნება უსაფრთხოების სწავლების ახალ მეთოდს, სახელად safe completions, რომელიც მოდელს ასწავლის იყოს მაქსიმალურად სასარგებლო, უსაფრთხოების ფარგლების დაცვით. ეს შეიძლება ნიშნავდეს ნაწილობრივი ან მაღალ დონეზე მოცემული პასუხის გაცემას იმ დეტალების ნაცვლად, რომლებიც შესაძლოა სახიფათო იყოს.

სად შეიძლება ჩვენს სისტემებს შეზღუდვები ჰქონდეთ, რატომ და როგორ ვაგვარებთ ამას

ამ დამცავი მექანიზმების მიუხედავად, ყოფილა მომენტები, როცა ჩვენი სისტემები მგრძნობიარე სიტუაციებში ისე არ მოქცეულა, როგორც იყო განზრახული. აი რამდენიმე მიმართულება, რომელთა გაუმჯობესებაზეც ვმუშაობთ.

დამცავი მექანიზმების გაძლიერება ხანგრძლივ საუბრებში.

ჩვენი დამცავი მექანიზმები უფრო საიმედოდ მუშაობს ჩვეულებრივ, მოკლე გაცვლებში. დროთა განმავლობაში ვისწავლეთ, რომ ხანგრძლივ ინტერაქციებში ეს მექანიზმები ზოგჯერ ნაკლებად საიმედო შეიძლება იყოს: რაც უფრო იზრდება მიმოცვლა, მოდელის უსაფრთხოების ტრენინგის ნაწილი შეიძლება შესუსტდეს. მაგალითად, ChatGPT‑მა შეიძლება სწორად მიუთითოს სუიციდის ცხელი ხაზი, როცა ვინმე პირველად ახსენებს ასეთ განზრახვას, მაგრამ მრავალი შეტყობინებისა და დიდი ხნის შემდეგ, შეიძლება ბოლოს შესთავაზოს პასუხი, რომელიც ჩვენს დამცავ მექანიზმებს ეწინააღმდეგება. სწორედ ასეთი ჩავარდნის პრევენციაზე ვმუშაობთ. ვაძლიერებთ ამ შემამსუბუქებელ ზომებს, რათა ისინი ხანგრძლივ საუბრებშიც საიმედო დარჩეს, და ვიკვლევთ გზებს, როგორ უზრუნველვყოთ მდგრადი ქცევა რამდენიმე საუბრის მასშტაბით. ასე რომ, თუ ვინმე ერთ ჩატში სუიციდურ განზრახვას გამოხატავს და შემდეგ სხვა ჩატს იწყებს, მოდელს მაინც შეეძლება სათანადო რეაგირება.

კონტენტის დაბლოკვის დახვეწა.

გვინახავს შემთხვევები, როცა კონტენტი, რომელიც უნდა დაბლოკილიყო, არ დაბლოკილა. ასეთი ხარვეზები, როგორც წესი, იმიტომ ხდება, რომ კლასიფიკატორი ნანახის სიმძიმეს სათანადოდ ვერ აფასებს. ჩვენ ამ ზღვარებს ვასწორებთ, რათა დაცვა მაშინ ამოქმედდეს, როცა საჭიროა.

ჩვენი უმთავრესი პრიორიტეტია დავრწმუნდეთ, რომ ChatGPT მძიმე მომენტს კიდევ უფრო არ ამძიმებს.

რას ვგეგმავთ მომავალში

სამუშაო მხოლოდ ზემოთ ჩამოთვლილის გამოსწორებით არ სრულდება. ასევე ვგეგმავთ: 

ინტერვენციების გაფართოებას უფრო მეტ კრიზისში მყოფ ადამიანზე.

მიუხედავად იმისა, რომ ჩვენი საწყისი შემამსუბუქებელი ზომები მწვავე თვითდაზიანებას ანიჭებდა პრიორიტეტს, ზოგი ადამიანი ფსიქიკური სტრესის სხვა ფორმებს განიცდის. მაგალითად, ვინმემ შეიძლება ენთუზიაზმით უთხრას მოდელს, რომ შეუძლია 24/7 იაროს მანქანით, რადგან მიხვდა, რომ დაუმარცხებელია მას შემდეგ, რაც ორი ღამე არ უძინია. დღეს ChatGPT‑მა შეიძლება ეს სახიფათოდ ვერ ამოიცნოს ან ვერ დაასკვნას, რომ პრობლემა არსებობს და — ცნობისმოყვარე გამოკვლევით — შეიძლება ეს დახვეწილად გააძლიეროს.

ჩვენ ვმუშაობთ GPT‑5‑ის განახლებაზე, რომელიც ChatGPT‑ს აიძულებს დაძაბულობის განმუხტვას ადამიანის სანდო წყაროებთან დაკავშირებით რეალობასთან. ამ მაგალითში ის აუხსნიდა, რომ ძილის ნაკლებობა სახიფათოა და ნებისმიერ ქმედებამდე დასვენებას ურჩევდა.

გადაუდებელ სამსახურებთან დაკავშირების და ექსპერტებისგან დახმარების მიღების კიდევ უფრო გამარტივება.

დღეს, როცა ადამიანები საკუთარი თავისთვის ზიანის მიყენების განზრახვას გამოხატავენ, მათ დახმარების ძიებისკენ მოვუწოდებთ და რეალურ სამყაროში არსებულ რესურსებთან ვაკავშირებთ. უკვე დავიწყეთ რესურსების ლოკალიზაცია აშშ-სა და ევროპაში და ვგეგმავთ გაფართოებას სხვა გლობალურ ბაზრებზეც. ასევე გავზრდით ხელმისაწვდომობას გადაუდებელ სამსახურებთან ერთი დაწკაპუნებით წვდომით.

ვიკვლევთ, როგორ ჩავერიოთ უფრო ადრე და როგორ დავაკავშიროთ ადამიანები სერტიფიცირებულ თერაპევტებთან მანამდე, სანამ მწვავე კრიზისში აღმოჩნდებიან. ეს ნიშნავს, რომ უნდა გავცდეთ მხოლოდ კრიზისის ცხელ ხაზებს და განვიხილოთ, როგორ შეიძლება ავაშენოთ ლიცენზირებული პროფესიონალების ქსელი, რომელთან დაკავშირებასაც ადამიანები პირდაპირ ChatGPT‑ით შეძლებენ. ამას დრო და დიდი სიფრთხილე დასჭირდება, რომ სწორად განხორციელდეს.

სანდო კონტაქტებთან დაკავშირების შესაძლებლობის ჩართვა.

გადაუდებელი სამსახურების გარდა, ვიკვლევთ გზებს, რომ ადამიანებისთვის გაუადვილდეს მათთან დაკავშირება, ვინც მათთან ყველაზე ახლოსაა. ეს შეიძლება მოიცავდეს ერთი დაწკაპუნებით შეტყობინებებს ან ზარებს შენახულ საგანგებო კონტაქტებთან, მეგობრებთან ან ოჯახის წევრებთან, შემოთავაზებული ტექსტით, რათა საუბრის დაწყება ნაკლებად შემაშინებელი იყოს.

ასევე განვიხილავთ ფუნქციებს, რომლებიც ადამიანებს საშუალებას მისცემს სურვილის შემთხვევაში ჩართონ, რომ მძიმე შემთხვევებში ChatGPT მათ ნაცვლად დაუკავშირდეს დანიშნულ კონტაქტს.

თინეიჯერებისთვის დაცვის გაძლიერება.

ისტორიულად, ყველა ჩვენი მომხმარებლისთვის მოდელის ერთი იდეალური ქცევა გვქონდა განსაზღვრული; ChatGPT‑ის ზრდასთან ერთად დავიწყეთ დამატებითი დაცვის დამატება, როცა ვიცით, რომ მომხმარებელი 18 წლამდეა. ვაგრძელებთ ისეთი დამცავი მექანიზმების შემუშავებას და დანერგვას, რომლებიც თინეიჯერების განვითარების უნიკალურ საჭიროებებს ამოიცნობს, მგრძნობიარე კონტენტისა და სარისკო ქცევების მიმართ უფრო ძლიერი შეზღუდვებით.

მალე ასევე წარმოვადგენთ მშობელთა კონტროლი ფუნქციებს, რომლებიც მშობლებს მისცემს შესაძლებლობას უკეთ გაიგონ და გავლენა მოახდინონ იმაზე, როგორ იყენებენ მათი თინეიჯერები ChatGPT‑ს. ასევე ვიკვლევთ შესაძლებლობას, რომ თინეიჯერებმა (მშობლების ზედამხედველობით) სანდო საგანგებო კონტაქტი დანიშნონ. ასე, მწვავე სტრესის მომენტებში, ChatGPT‑ს შეეძლება მხოლოდ რესურსების მითითებაზე მეტი გააკეთოს: დაეხმაროს თინეიჯერებს პირდაპირ დაუკავშირდნენ ადამიანს, რომელსაც ჩარევა შეუძლია.

ღრმად გვესმის, რომ დამცავი მექანიზმები ყველაზე ძლიერია მაშინ, როცა თითოეული ელემენტი ისე მუშაობს, როგორც არის ჩაფიქრებული. ჩვენ გავაგრძელებთ გაუმჯობესებას, ექსპერტების ხელმძღვანელობით და ჩვენი ინსტრუმენტების მომხმარებლების წინაშე პასუხისმგებლობაზე დაყრდნობით — და იმედი გვაქვს, სხვებიც შემოგვიერთდებიან, რათა დავრწმუნდეთ, რომ ეს ტექნოლოგია ადამიანებს მათი ყველაზე მოწყვლადი მომენტების დროს იცავს.