გადადით მთავარ შინაარსზე
OpenAI

23 ოქტომბერი, 2025

Consensus იყენებს GPT‑5‑სა და Responses API-ს, რათა კვირების კვლევა წუთებში დაასრულოს

GPT‑5‑ისა და Responses API-ს გამოყენებით, Consensus-მა შექმნა მრავალაგენტიანი სისტემა, რომელიც გეგმავს, კითხულობს და აჯამებს მტკიცებულებებს ისე, როგორც ამას მკვლევრები აკეთებენ.

Consensus-ის თეთრი ლოგო, ცენტრში განთავსებული მუქი ლურჯ-მწვანე ფონზე, ვერტიკალური ტექსტურიანი პანელებით ლურჯისა და მწვანის სხვადასხვა ტონებში.
იტვირთება…

ყოველწლიურად ქვეყნდება მილიონობით ახალი სამეცნიერო ნაშრომი — გაცილებით მეტი, ვიდრე ერთ ადამიანს შეუძლია წაიკითხოს.

მეცნიერებისთვის გამოწვევა ცოდნაზე წვდომა კი არა, მისი მოძიების, ინტერპრეტაციისა და ერთმანეთთან დაკავშირების უზარმაზარი ამოცანაა. გარღვევები ხდება ცნობილის საზღვარზე, თუმცა მკვლევრები დროის უმეტეს ნაწილს ამ საზღვრების პოვნაში ხარჯავენ, ნაცვლად იმისა, რომ მათ გასცდნენ.

Consensus(იხსნება ახალ ფანჯარაში), კვლევითი ასისტენტი, რომელსაც 8 მილიონზე მეტი ადამიანი იყენებს, სწორედ ამის შესაცვლელად შეიქმნა. Christian Salem-ისა და Eric Olson-ის მიერ დაფუძნებული პლატფორმა ეძებს, კითხულობს და აჯამებს რეცენზირებულ ლიტერატურას 220 მილიონზე მეტ ნაშრომში. მისი უახლესი შესაძლებლობა, Scholar Agent, არის GPT‑5‑სა და Responses API-ზე აგებული მრავალაგენტიანი სისტემა. ის ასახავს, როგორ მუშაობენ რეალურად მკვლევრები და ეხმარება მათ კითხვიდან დასკვნამდე წუთებში მივიდნენ, კვირების ნაცვლად.

თუმცა მიზანი მხოლოდ უფრო სწრაფი კვლევა არ არის — ეს არის აღმოჩენამდე უფრო სწრაფი გზა. «მეცნიერება წინ მიდის, როცა ის უფრო ხელმისაწვდომია», — ამბობს Salem. «ჩვენი საქმეა, ყველგან მივცეთ მკვლევრებს შესაძლებლობა, იპოვონ, ენდონ და იმოქმედონ მტკიცებულებაზე დაყრდნობით.»

საძიებო სისტემიდან აგენტულ ასისტენტამდე

Consensus-ის პირველი ვერსია მეცნიერებისთვის ვერტიკალურ საძიებო სისტემას ჰგავდა: ის ინდექსირებდა აკადემიურ ნაშრომებს, აბრუნებდა შესაბამის შედეგებს და ქმნიდა ციტირებებზე დაფუძნებულ შეჯამებებს. მაგრამ მხოლოდ ძიება საკმარისი არ იყო.

«კვლევა მხოლოდ ნაშრომების პოვნა არ არის», — ამბობს Salem. «ეს არის შედეგების ინტერპრეტაცია, მიგნებების შედარება და იდეების დაკავშირება. რაც უფრო მეტ დროს ხარჯავენ მეცნიერები ძიებაში, კითხვასა და წინა ცოდნის ინტერპრეტაციაში სწორი კვლევის საპოვნელად, მით ნაკლები დრო რჩებათ აღმოჩენისთვის და ნამდვილი კვლევის ჩასატარებლად.»

ამიტომ გუნდმა დაიწყო Consensus-ის ახალი კონცეფციის გარშემო თავიდან არქიტექტირება: მრავალაგენტიანი სისტემა სახელწოდებით «Scholar Agent», რომელიც ისე მუშაობს, როგორც ადამიანი მკვლევარი.

GPT‑5‑სა და Responses API-ზე აგებული სისტემა ახლა აგენტების კოორდინირებულ სამუშაო პროცესს მართავს:

  • Planning Agent შლის მომხმარებლის კითხვას ნაწილებად და წყვეტს, შემდეგ რა მოქმედებები უნდა განხორციელდეს
  • Search Agent იკვლევს Consensus-ის ნაშრომების ინდექსს, მომხმარებლის პირად ბიბლიოთეკასა და ციტირების გრაფს
  • Reading Agent ნაშრომებს ინდივიდუალურად ან ჯგუფებად ინტერპრეტირებს
  • Analysis Agent აჯამებს შედეგებს, განსაზღვრავს სტრუქტურასა და ვიზუალებს და ქმნის საბოლოო პასუხს

თითოეულ აგენტს ვიწრო სფერო აქვს, რაც მსჯელობას ზუსტს ინარჩუნებს და ჰალუცინაციებს ამცირებს. არქიტექტურა ასევე Consensus-ს საშუალებას აძლევს გადაწყვიტოს, როდის არ უპასუხოს; თუ შესაბამისი კვლევები მის ხარისხის ზღვარს ვერ აკმაყოფილებს, ასისტენტი ამას უბრალოდ პირდაპირ ამბობს.

«სამუშაო პროცესის აგენტებს შორის გაყოფით, შეცდომებს ვამცირებთ და სისტემას გაცილებით უფრო დისციპლინირებულს ვხდით», — ამბობს Salem. «არცერთ აგენტს არ ეკისრება ზედმეტი პასუხისმგებლობა, რაც, როგორც აღმოჩნდა, სანდოობისთვის გადამწყვეტია.»

აგენტების ნაკადის დიაგრამა, რომელიც აჩვენებს, როგორ მუშავდება მომხმარებლის მოთხოვნა დაგეგმვის, პარალელური ძიების, კითხვისა და ანალიზის აგენტების მეშვეობით, რათა შეიქმნას კვლევაზე დაფუძნებული შედეგი.

ეს მიდგომა არის ის, რასაც გუნდი კონტექსტის ინჟინერიას უწოდებს: სწორი მტკიცებულებების შეკრება მანამდე, სანამ გენერირება დაიწყება. ყველა პასუხს ახლავს „კვლევითი კონტექსტის პაკეტი“ — ნაშრომების, მეტამონაცემებისა და ძირითადი მიგნებების სტრუქტურირებული ნაკრები, რომელიც საწყის კვლევებამდე მიდის.

«არ გვინდა, მკვლევრები დროს კარგავდნენ ყოველი მტკიცების ორმაგ შემოწმებაზე», — ამბობს Salem. «თუ სისტემა პასუხს რეალურ მტკიცებულებაზე ვერ დააფუძნებს, ის არაფერს მოიგონებს.»

შექმნა Responses API-ით

Consensus მრავალაგენტიანი მარშრუტიზაციის მხარდასაჭერად Chat Completions-იდან Responses API-ზე გადავიდა. ამ ცვლილებამ გააუმჯობესა როგორც სანდოობა, ისე ხარჯების ეფექტიანობა და გუნდს ქვეაგენტების გამოძახებებზე უფრო ზუსტი კონტროლი მისცა. GPT‑5‑ის გრძელკონტექსტური მსჯელობისა და საიმედო tool-calling-ის პირობებში არჩევანი აშკარა იყო.

ადრეულმა შეფასებებმა ეს არჩევანი დაადასტურა: GPT‑5‑მა tool-calling-ის სიზუსტესა და დაგეგმვის სტაბილურობაში აჯობა GPT‑4.1‑ს, Sonnet 4-ს და Gemini 2.5 Pro-ს. ამან Consensus-ის გუნდს საშუალება მისცა ნაკლებად ეფიქრა მოთხოვნის რთულ ხრიკებზე და მეტად კონცენტრირებულიყო აგენტის ქცევების შექმნაზე, რომლებიც პირდაპირ შეესაბამება კვლევის სამუშაო პროცესებს.

ცხრილი, რომელიც ადარებს GPT-5 Research Agent-ის მეტრიკებს OAI, Anthropic-ისა და Google-ის მოდელებისთვის სიზუსტის, სიზუსტის ხარისხის, სტრუქტურისა და დაყოვნების მიხედვით.

სამომხმარებლო ფსონი ინსტიტუციების სამყაროში

თავიდანვე Consensus ბაზარს მოსალოდნელისგან განსხვავებულად მიუდგა. ინსტიტუციების მეშვეობით გაყიდვის ნაცვლად, გუნდი ფოკუსირდა იმ ადამიანებზე, რომლებიც თავად აკეთებენ კვლევას: სტუდენტებზე, პროფესორ-მასწავლებლებზე და კლინიცისტებზე, რომლებსაც პასუხები დღესვე სჭირდებოდათ. სწორედ ამ უშუალო ფოკუსმა მკვლევრებზე განსაზღვრა როგორც პროდუქტის დიზაინი, ისე მისი სწრაფი ზრდა.

«ყველა ამბობდა, რომ აკადემიაში პირდაპირ მომხმარებელზე გასვლა შეუძლებელია, მაგრამ AI-მ ეს შეცვალა», — ამბობს Salem. «ადამიანები აღარ ელოდებიან დამტკიცებას — ისინი იყენებენ იმას, რაც მუშაობს.»

ამ გადაწყვეტილებამ განსაზღვრა პროდუქტის ტონიც და ზრდის ტრაექტორიაც. Consensus უფრო თანამედროვე სამომხმარებლო აპს ჰგავს, ვიდრე ტრადიციულ აკადემიურ ხელსაწყოს: სწრაფი ონბორდინგი, ინტუიციური დიზაინი, სასაუბრო ინტერფეისი. დანერგვა ზეპირი რეკომენდაციების გზით გავრცელდა კამპუსებსა და ლაბორატორიებში.

პირველი აქტიური მომხმარებლები სამაგისტრო სტუდენტები და PhD კანდიდატები გახდნენ, შემდეგ კი — პროფესორ-მასწავლებლები და კერძო მკვლევრები. შემდეგ მათ შეუერთდნენ კლინიცისტები, რომლებმაც Consensus-ის გამოყენება თავიანთ სფეროებში უახლესი მტკიცებულებების მოსაძიებლად დაიწყეს.

«ჩვენ ექიმებისთვის შექმნა მიზნად არ დაგვისახავს», — ამბობს Salem. «მაგრამ მათაც ისევე სჭირდებათ იგივე, რაც მკვლევრებს: სწრაფი წვდომა სანდო მტკიცებულებებზე.»

კომპანიამ ცოტა ხნის წინ გააფორმა Mayo Clinic-ის სამედიცინო ბიბლიოთეკასთან ხელშეკრულება და ახლახან გამოუშვა „Medical Mode“, ახალი ფუნქცია, რომელიც განკუთვნილია პრაქტიკოსებისთვის, რომლებიც კლინიკურ მტკიცებულებებს ეძებენ.

მეცნიერებასთან ერთად მასშტაბირება

გასულ წელს Consensus სწრაფად გაფართოვდა, 8 მილიონზე მეტ მკვლევრამდე გაიზარდა მსოფლიოში და შემოსავალი 8-ჯერ გაზარდა.

ამ ზრდას პროდუქტის პრიორიტეტები არ შეუცვლია. თითოეული ფუნქცია კვლავაც გადამოწმებად, დაბალჰალუცინაციურ პასუხებზეა აგებული. გუნდმა მნიშვნელოვნად ჩადო რესურსი შეფასების პაიპლაინებში, რომლებიც აგენტებს შორის ამოწმებს სიზუსტეს, ციტირების მიკვლევადობას და სტილისტიკურ თანმიმდევრულობას.

Consensus-ის არქიტექტურა განზრახ მოდულურია და ისეა შექმნილი, რომ ახალმა აგენტებმა მარტივად დაიკავონ ადგილი, როცა მოდელები გაფართოვდება და გაუმჯობესდება — აგენტებმა, რომლებიც ექსპერიმენტებს იმეორებენ, ფიგურებს ქმნიან ან სტატისტიკურ ანალიზებს ატარებენ.

«ვქმნით ასისტენტს, რომელიც მკვლევრებს რეალურად სჭირდებათ სწრაფად ცვალებად სამყაროში», — ამბობს Salem. «მოდელები სულ უკეთესდება, სისტემა მათთან ერთად იზრდება და მეცნიერებაც უფრო სწრაფად მოძრაობს.»

OpenAI <3 სტარტაპები. მოდით, ჩვენთან ერთად შექმენით.