როგორ გავრცელდა გობლინური გამონატანები ხელოვნური ინტელექტის მოდელებში: ქრონოლოგია, ძირითადი მიზეზები და გასწორებები, რომლებიც GPT-5-ის ქცევაში პიროვნულობით განპირობებულ თავისებურებებს უკავშირდება.
გაიგეთ, როგორ служს OpenAI-ის მოდელის სპეციფიკაცია მოდელის ქცევის საჯარო ჩარჩოდ, რომელიც აბალანსებს უსაფრთხოებას, მომხმარებლის თავისუფლებასა და ანგარიშვალდებულებას AI სისტემების განვითარების ფონზე.
როგორ იყენებს OpenAI აზროვნების ჯაჭვის მონიტორინგს შიდა კოდირების აგენტებში მისალაინმენტის შესასწავლად — რეალურ დანერგვებში რისკების ანალიზისა და AI უსაფრთხოების დამცავი მექანიზმების გასაძლიერებლად.
IH-Challenge ასწავლის მოდელებს, მიანიჭონ პრიორიტეტი სანდო ინსტრუქციებს, რაც აუმჯობესებს ინსტრუქციების იერარქიას, უსაფრთხოების steerability-ს და პრომპტ ინიექციის შეტევებისადმი მდგრადობას.
OpenAI წარმოგიდგენთ CoT-Control-ს და აჩვენებს, რომ მსჯელობის მოდელებს უჭირთ საკუთარი აზროვნების ჯაჭვის კონტროლი, რაც AI-ის უსაფრთხოების დამცავ მექანიზმად მონიტორინგის შესაძლებლობას ამყარებს.
ახალი პრეპრინტი ერთმინუსიან ამპლიტუდებს გრავიტონებზე ავრცელებს; GPT-5.2 Pro დაეხმარა კვანტურ გრავიტაციაში არანულოვანი გრავიტონული ხის ამპლიტუდების მიღებასა და გადამოწმებაში.