გადადით მთავარ შინაარსზე
OpenAI

28 ოქტომბერი, 2025

Doppel-ის AI დაცვის სისტემა თავდასხმებს გავრცელებამდე აჩერებს

GPT‑5-ისა და განმტკიცებითი დახვეწის (RFT) დახმარებით Doppel-მა ანალიტიკოსების დატვირთვა 80%-ით შეამცირა და ახლა საფრთხეებს საათების ნაცვლად წუთებში ანეიტრალებს.

Doppel-ის თეთრი ლოგო ცენტრში, ტექსტურიან მუქ მეტალურ ფონზე, მოღუნული ხაზებითა და მოქლონებით.
კომპანიის ზომა: სტარტაპი
რეგიონი: ჩრდილოეთ ამერიკა
ინდუსტრია: ტექნოლოგია
პროდუქტები: API

შედეგები

80%

ანალიტიკოსების სამუშაო ნაკადების შემცირება

შედეგები

3x

საფრთხეების დამუშავების შესაძლებლობა

იტვირთება…

ერთმა იმიტაციის საიტმა შეიძლება ამოქმედდეს, ათასობით მომხმარებელი ამოიღოს მიზანში და ერთ საათზე ნაკლებ დროში გაქრეს. ეს თავდამსხმელისთვის სრულიად საკმარისი დროა რეალური ზიანის მისაყენებლად. ხოლო გენერაციული ხელსაწყოებით მათ შეუძლიათ ასობით მსგავსი საიტი კიდევ შექმნან.

Doppel შეიქმნა იმისთვის, რომ ორგანიზაციები deepfake-ებისა და ონლაინ იმიტაციებისგან დაეცვა, თუმცა მალე მიხვდა, რომ AI-ის პირობებში საფრთხეების მასშტაბირება უსასრულოდ იყო შესაძლებელი. თავდამსხმელებს აღარ სჭირდებოდათ თაღლითობის სქემების ხელით აწყობა; მათ უკვე შეეძლოთ წამებში შეექმნათ ფიშინგ-კიტების, ყალბი დომენებისა და იმიტაციის ანგარიშების უსასრულო ვარიანტები.

„ფიშინგ-შეტევებით გამოწვეული ზიანი შეიძლება წუთებში დადგეს, რადგან ისინი სოციალურ მედიასა და შეტყობინებების არხებში სწრაფად ვრცელდება. თითქმის ნულოვან ფასად უსასრულო დარწმუნების შესაძლებლობამ ყველაფერი შეცვალა.“
—Rahul Madduluri, თანადამფუძნებელი და CTO, Doppel

დანერგვის შიგნით

წინ რომ დარჩენილიყო, Doppel-მა შეიმუშავა სოციალური ინჟინერიისგან დაცვის ახალი ტიპის სისტემა, რომელიც OpenAI GPT‑5 და o4-mini მოდელებზეა აგებული. Doppel-ის პლატფორმა ავტონომურად ამოიცნობს, ახარისხებს და აუქმებს საფრთხეებს, ანალიტიკოსების დატვირთვას 80%-ით ამცირებს, საფრთხეების დამუშავების შესაძლებლობას სამმაგად ზრდის და რეაგირების დროს საათებიდან წუთებამდე ამცირებს.

უსასრულოდ უფრო სწრაფ საფრთხეებზე წინ დარჩენა

ციფრული რისკების დაცვის ტრადიციული მიდგომა ეყრდნობოდა ადამიანებს, რომლებიც ხელით ამოწმებდნენ იმიტაციის საიტებს, ფიშინგ-დომენებს და სოციალური მედიის პროფილებსა და პოსტებს. Doppel-მა დაინახა, რომ ეს მოდელი იშლებოდა, რადგან თავდამსხმელები ავტომატიზაციაზე გადავიდნენ და საფრთხეებს უფრო სწრაფად და უფრო მეტ ზედაპირზე ავრცელებდნენ, ვიდრე ადამიანებს მათი შეფასება შეეძლოთ.

„ჩვენი სისტემა სიგნალების უწყვეტ ნაკადს ამუშავებს, რათა ხმაურში რეალური საფრთხეები გამოავლინოს. როგორც კი საფრთხე გამოვლინდება, მოქმედებისთვის ძალიან ვიწრო დროის ფანჯარა რჩება, სანამ ზიანი დადგება. გადაწყვეტილებების მისაღებად AI-ის გამოყენება კომპანიისთვის ერთ-ერთი ყველაზე დიდი გარღვევაა, რაც გვაძლევს საშუალებას შეტევებს ინტერნეტის მასშტაბითა და სისწრაფით ვუპასუხოთ.“
—Rahul Madduluri, თანადამფუძნებელი და CTO, Doppel

ეს სისწრაფე Doppel-ის მომხმარებლებისთვის კრიტიკულად მნიშვნელოვანია — იმ ორგანიზაციებისთვის, რომლებსაც საათობით ლოდინის ფუფუნება არ აქვთ, სანამ საფრთხე დადასტურდება. Doppel-ის სისტემა საფრთხეების უმეტესობას ავტომატურად ახარისხებს, OpenAI-ის მოდელებს მსჯელობისთვის იყენებს და დროთა განმავლობაში მოდელის გასაუმჯობესებლად იყენებს სტრუქტურირებულ უკუკავშირის ციკლს, რომელსაც განმტკიცებითი დახვეწა (RFT) ეწოდება. RFT-ში ადამიანური უკუკავშირი ფასდება როგორც შეფასებული მაგალითები, რაც მოდელებს ეხმარება თავად მიიღონ თანმიმდევრული და ახსნადი გადაწყვეტილებები.

LLM-ზე დაფუძნებული საფრთხეების ამოცნობის ორკესტრირება

Doppel-ის LLM-ზე დაფუძნებული კონვეიერი მისი ამოცნობის სტეკის ცენტრში დგას. მას შემდეგ, რაც სიგნალები მოიპოვება და გაიფილტრება, სისტემა ასრულებს მიზანმიმართული მსჯელობის ამოცანების სერიას: აფასებს პოტენციურ საფრთხეებს, ადასტურებს განზრახვას და წარმართავს კლასიფიკაციის გადაწყვეტილებებს. თითოეული ეტაპი ისეა შექმნილი, რომ დააბალანსოს სისწრაფე, სიზუსტე და თანმიმდევრულობა, ხოლო ანალიტიკოსები იმ სასაზღვრო შემთხვევებზე იყოს ფოკუსირებული, სადაც ადამიანური განსჯაა საჭირო.

ფლოჩარტი აჩვენებს LLM-ების გამოყენებით საფრთხის ამოცნობის კონვეიერს, რომელიც გადადის წყაროს მიღებიდან და ფილტრაციიდან, მახასიათებლების გამოყოფისა და კლასიფიკაციის გავლით, საბოლოო გადამოწმებასა და გათიშვის სისტემებამდე. GPT-5-ისა და o4-mini-ის მსგავსი მოდელები საკვანძო ეტაპებზე გამოიყენება.

აი, როგორ მუშაობს ეს:

  • სიგნალების გაფილტვრა და მახასიათებლების ექსტრაქცია: Doppel-ის სისტემები ყოველდღიურად მილიონობით დომენს, URL-სა და ანგარიშს იღებს. ევრისტიკებისა და OpenAI o4-mini-ის კომბინაცია ფილტრავს ხმაურს და გამოაქვს სტრუქტურირებული მახასიათებლები, რომლებიც შემდგომი მოდელური შეფასებების წარმართვას ემსახურება.
  • საფრთხის პარალელური დადასტურება: თითოეული სიგნალი გადის რამდენიმე GPT‑5 მოთხოვნაზე, რომლებიც სპეციალურად სხვადასხვა ტიპის საფრთხის ანალიზისთვისაა შექმნილი. ეს მოთხოვნები აფასებს ისეთ ფაქტორებს, როგორიცაა იმიტაციის რისკი, ბრენდის ბოროტად გამოყენება ან სოციალური ინჟინერიის ნიმუშები.
  • საფრთხის კლასიფიკაცია: o4-mini-ის RFT ვერსია აერთიანებს წინა დადასტურებებს, რათა მიანიჭოს სტრუქტურირებული იარლიყი — მავნე, უვნებელი ან ბუნდოვანი — საწარმოო დონის თანმიმდევრულობით.
  • საბოლოო გადამოწმება: GPT‑5-ის მეორე გავლა ადასტურებს მოდელის გადაწყვეტილებას და ქმნის ბუნებრივ ენაზე დასაბუთებას. თუ ნდობის დონე ზღვარს აჭარბებს, სისტემა ავტომატურად იწყებს აღსრულებას.
  • ადამიანის მიმოხილვა: დაბალი ნდობის მქონე ან ურთიერთსაწინააღმდეგო შედეგები ადამიან ანალიტიკოსებთან იგზავნება. მათი გადაწყვეტილებები ლოგდება და RFT ციკლში ბრუნდება, რათა მოდელის თანმიმდევრულობა უწყვეტად გაუმჯობესდეს.

მოდელების გაწვრთნა განმტკიცებითი დახვეწით (RFT)

Doppel-ს უკვე ჰქონდა მნიშვნელოვანი შედეგები თავისი საწყისი, LLM-ით გაძლიერებული ამოცნობის კონვეიერიდან, მაგრამ იმ შემთხვევებში, როცა ერთი და იგივე საფრთხე ანალიტიკოსის მიხედვით სხვადასხვაგვარად ფასდებოდა, მთავარი შემზღუდველი ფაქტორი სწორედ თანმიმდევრულობა გახდა.

„RFT-დან მიღებული ერთი რეალური სარგებელი ის არის, რომ მოდელის გადაწყვეტილებები უფრო თანმიმდევრული ხდება.“
—Kiran Arimilli, პროგრამული ინჟინერი, Doppel

ამ თანმიმდევრულობის მისაღწევად Doppel-მა RFT გამოიყენა და უკუკავშირის წყაროდ საკუთარი ანალიტიკოსების მონაცემები აიღო. თითოეული გადაწყვეტილება — დომენი მავნედ, უვნებლად თუ გაურკვევლად კლასიფიცირებულიყო — შეფასებულ მაგალითად იქცა. ამ მონიშნულმა მაგალითებმა მოდელი გაწვრთნა ისე, რომ ექსპერტების განსჯა გაემეორებინა, მათ შორის ბუნდოვან სასაზღვრო შემთხვევებშიც.

წრიული დიაგრამა აჩვენებს Doppel-ის საფრთხეების კლასიფიკაციის სამუშაო პროცესს: საწარმოო LLM-ები იღებენ გადაწყვეტილებებს → ადამიანების რევიუერები ასწორებენ → მოდელის სწავლება ანახლებს მოდელებს → განთავსება განახლებულ მოდელებს საწარმოო გარემოში აგზავნის.

OpenAI-ის აპლაიდ ინჟინერიის გუნდთან მჭიდრო თანამშრომლობით Doppel-მა შეიმუშავა შემფასებელი ფუნქციები, რომლებიც არა მხოლოდ სიზუსტეს, არამედ ახსნის ხარისხსაც აფასებდა და აჯილდოებდა მოდელებს, რომლებიც ნათლად მსჯელობდნენ და არა მხოლოდ სწორ პასუხს იძლეოდნენ. ანალიტიკოსების უკუკავშირის სტრუქტურირებულ სასწავლო მონაცემებად გარდაქმნით Doppel-მა აჩვენა, როგორ შეუძლია RFT-ს ავტომატური ამოცნობა უფრო თანმიმდევრული და სანდო გახადოს.

ნდობის ოპერატიულად დანერგვა გამჭვირვალობის გზით

ჰიპერპარამეტრების მორგებამ და განმეორებითმა შეფასებებმა მოდელი ადამიანურ დონესთან უფრო ახლოს მიიყვანა თანმიმდევრულობაში. თუმცა Doppel-ისთვის ავტომატიზაციის ბოლო ეტაპის გავლა იმასაც ნიშნავდა, რომ გადაწყვეტილებები დაუყოვნებლივ გასაგები უნდა გამხდარიყო.

ახლა ყოველი ავტომატური გათიშვა შეიცავს AI-ის მიერ შექმნილ დასაბუთებას, რომელიც განმარტავს, რატომ წაიშალა საფრთხე, და მომხმარებლებს მაშინვე აძლევს ხედვას, რატომ იქნა ქმედება განხორციელებული — იმას, რაც ადრე ანალიტიკოსის ჩარევას საჭიროებდა.

დაშბორდის ხედზე ნაჩვენებია დომენ „d0ppel.click“-ის გათიშვის შეტყობინება, რომელიც Doppel-ის იმიტაციისთვისაა მონიშნული. შეჯამებაში ნახსენებია ფიშინგი და წვდომის მონაცემების ქურდობა, მარჯვნივ კი ქრონოლოგია აჩვენებს სტატუსის განახლებებს შექმნიდან დასრულებამდე 2025 წლის 10 ოქტომბერს.

ეს ხილვადობა აძლიერებს ნდობას, რაც Doppel-ის მომხმარებლებისთვის კრიტიკულად მნიშვნელოვანი ფაქტორია. როცა ხედავ არა მხოლოდ რა ქმედება განხორციელდა, არამედ რატომ, გუნდებს ეძლევათ თავდაჯერება სწრაფად იმოქმედონ და მიიღონ კონტექსტი, რომ ეს გადაწყვეტილებები შიგნით ან დაინტერესებულ მხარეებთან ახსნან.

შედეგები მოკლედ

  • ანალიტიკოსების დატვირთვა შემცირდა 80%-ით
  • საფრთხეებზე რეაგირების დრო შემცირდა საათებიდან წუთებამდე
  • საფრთხეების დამუშავების შესაძლებლობა გასამმაგდა
  • საფრთხეების უმეტესობა ავტომატურად კლასიფიცირდება

რა იქნება შემდეგ

მას შემდეგ, რაც Doppel-მა ფიშინგისა და იმიტაციის დომენებისთვის თითქმის სრულ ავტომატიზაციას მიაღწია, ახლა იმავე მოდელზე დაფუძნებულ ჩარჩოს სხვა მაღალი ვარიაბელობის არხებზეც ავრცელებს.

„დომენები, ალბათ, ყველაზე რთული არხია, რომელსაც ვმართავთ,“ თქვა მადულურიმ. „სიგნალები არეულია, კონტენტი მუდმივად იცვლება და საფრთხეები ერთდროულად რამდენიმე ზედაპირზე სწრაფად ვითარდება. თუ ამის ბოლომდე ავტომატიზაცია შეგვიძლია, მაშინ ყველაფრისთვის შევძლებთ: სოციალური მედიისთვის, ფასიანი რეკლამებისთვის — რაც გინდათ.“

შემდეგი მნიშვნელოვანი ეტაპები მოიცავს მათი RFT მონაცემთა ნაკრების მასშტაბირებას მთელი რიგით, შეფასების ახალი სტრატეგიების გამოცდას და GPT‑5-ის გამოყენებას ზედა დონის მახასიათებლების ექსტრაქციისთვის. ეს ცვლილებები Doppel-ს საშუალებას მისცემს კონვეიერის ეტაპები გააერთიანოს და პროცესის უფრო ადრეულ ეტაპზე უფრო რთულ საფრთხის ინდიკატორებზე იმსჯელოს.

ყოველი იტერაციით Doppel აშენებს სისტემას, რომელიც რეალურს იცავს ყველა ზედაპირზე, სადაც ნდობას თავს ესხმიან.