გადადით მთავარ შინაარსზე
OpenAI

გაიცანით GPT‑5.3‑Codex‑Spark

ულტრა-სწრაფი მოდელი Codex-ში რეალურ დროში კოდირებისთვის.

იტვირთება…

დღეს ვუშვებთ GPT‑5.3‑Codex‑Spark‑ის კვლევით პრევიუს — GPT‑5.3‑Codex‑ის უფრო პატარა ვერსიას და ჩვენს პირველ მოდელს, რომელიც რეალურ დროში კოდირებისთვისაა შექმნილი. Codex-Spark აღნიშნავს Cerebras-თან ჩვენი პარტნიორობის პირველ ეტაპს, რომელიც იანვარში გამოვაცხადეთ. Codex-Spark ოპტიმიზებულია ისე, რომ თითქმის მყისიერად იგრძნობოდეს ულტრა-დაბალი ლატენტურობის მქონე ჰარდ웨어ზე — წამში 1000-ზე მეტ token-ს აწვდის და ამასთანავე რეალური კოდირების ამოცანებისთვის ძალიან ქმედუნარიანი რჩება.

Codex-Spark-ს Cerebras-ზე კვლევითი პრევიუს სახით ვაზიარებთ ChatGPT Pro მომხმარებლებისთვის, რათა დეველოპერებმა ექსპერიმენტირება ადრე დაიწყონ, სანამ Cerebras-თან ერთად ვზრდით მონაცემთა ცენტრების სიმძლავრეს, ვამყარებთ მომხმარებლის სრულ გამოცდილებას და ვნერგავთ ჩვენს უფრო დიდ მოწინავე მოდელებს.

ჩვენმა უახლესმა მოწინავე მოდელებმა განსაკუთრებული სიძლიერე აჩვენეს ხანგრძლივი ამოცანების შესრულებაში — მათ შეუძლიათ საათების, დღეების ან კვირების განმავლობაში ავტონომიურად იმუშაონ ჩარევის გარეშე. Codex-Spark ჩვენი პირველი მოდელია, რომელიც სპეციალურად Codex-თან რეალურ დროში მუშაობისთვისაა შექმნილი — მიზნობრივი ჩასწორებების შესატანად, ლოგიკის გადასაწყობად ან ინტერფეისების დასახვეწად და შედეგების დაუყოვნებლივ სანახავად. Codex-Spark-ით Codex ახლა მხარს უჭერს როგორც ხანგრძლივ, ამბიციურ ამოცანებს, ისე საქმის იმწუთასვე გაკეთებას. ვიმედოვნებთ, რომ ვისწავლით, როგორ გამოიყენებენ მას დეველოპერები, და გავითვალისწინებთ გამოხმაურებას, რადგან წვდომის გაფართოებას ვაგრძელებთ.

გაშვებისას Codex-Spark-ს 128k კონტექსტური ფანჯარა აქვს და მხოლოდ ტექსტს ამუშავებს. კვლევითი პრევიუს განმავლობაში Codex-Spark-ს საკუთარი rate limit-ები ექნება და გამოყენება სტანდარტულ rate limit-ებში არ ჩაითვლება. თუმცა, როცა მოთხოვნა მაღალია, მომხმარებლებს შორის სანდოობის დასაბალანსებლად შეიძლება შეზღუდული წვდომა ან დროებითი რიგი ნახოთ.

სიჩქარე და ინტელექტი

Codex-Spark ოპტიმიზებულია ინტერაქტიული მუშაობისთვის, სადაც ლატენტურობა ინტელექტზე არანაკლებ მნიშვნელოვანია. შეგიძლიათ მოდელთან რეალურ დროში ითანამშრომლოთ, მუშაობისას შეაჩეროთ ან გადაამისამართოთ და თითქმის მყისიერი პასუხებით სწრაფად გაიმეოროთ ციკლი. რადგან ის სიჩქარეზეა მორგებული, Codex-Spark თავის ნაგულისხმევ სამუშაო სტილს მსუბუქად ინარჩუნებს: შეაქვს მინიმალური, მიზნობრივი ცვლილებები და ტესტებს ავტომატურად არ უშვებს, თუ ამას არ სთხოვთ.

კოდირება

Codex-Spark პატარა, მაგრამ ძალიან ქმედუნარიანი მოდელია, რომელიც სწრაფი ინფერენსისთვისაა ოპტიმიზებული. SWE-Bench Pro-სა და Terminal-Bench 2.0-ზე — ორ ბენჩმარკზე, რომლებიც აგენტური პროგრამული ინჟინერიის შესაძლებლობას აფასებს — GPT‑5.3‑Codex‑Spark ძლიერ შედეგებს აჩვენებს და ამავდროულად ამოცანებს GPT‑5.3‑Codex‑თან შედარებით დროის მცირე ნაწილში ასრულებს.

ხანგრძლივობა შეფასებულია შემდეგის ჯამად: (1) შედეგის გენერირების დრო (output tokens ÷ sampling speed), (2) prefill დრო (prefill tokens ÷ prefill speed), (3) ხელსაწყოს გაშვების ჯამური დრო და (4) ქსელის ჯამური ზედნადები.

ლატენტურობის გაუმჯობესება ყველა მოდელისთვის

როცა Codex-Spark-ს ვწვრთნიდით, აშკარა გახდა, რომ რეალურ დროში თანამშრომლობისთვის მოდელის სიჩქარე მხოლოდ განტოლების ნაწილი იყო — ასევე გვჭირდებოდა ლატენტურობის შემცირება მოთხოვნა-პასუხის მთელ მილსადენში. ჩვენს harness-ში დანერგეთ სრულად გამავალი ლატენტურობის გაუმჯობესებები, რომლებიც ყველა მოდელს წაადგება. შიდა დონეზე გავამარტივეთ, როგორ მიედინება პასუხები კლიენტიდან სერვერზე და უკან, გადავწერეთ ჩვენი ინფერენსის სტეკის მნიშვნელოვანი ნაწილები და თავიდან მოვაწყვეთ სესიების ინიციალიზაცია, რათა პირველი ხილული token უფრო სწრაფად გამოჩნდეს და Codex გამეორებისას რეაგირებადი დარჩეს. მუდმივი WebSocket კავშირის დანერგვითა და Responses API-ის შიგნით მიზნობრივი ოპტიმიზაციებით კლიენტ/სერვერის თითო roundtrip-ზე ზედნადები 80%-ით შევამცირეთ, თითო token-ზე ზედნადები — 30%-ით, ხოლო პირველი token-ის მიღებამდე დრო — 50%-ით. WebSocket გზა Codex-Spark-ისთვის ნაგულისხმევად ჩართულია და მალე ყველა მოდელისთვის ნაგულისხმევი გახდება.

Cerebras-ის მხარდაჭერით

Codex-Spark მუშაობს Cerebras-ის Wafer Scale Engine 3(იხსნება ახალ ფანჯარაში)-ზე — მაღალი სიჩქარის ინფერენსისთვის სპეციალურად შექმნილ AI ამაჩქარებელზე, რომელიც Codex-ს ლატენტურობაზე ორიენტირებულ სერვინგის ფენას აძლევს. Cerebras-თან ვითანამშრომლეთ, რათა ეს დაბალი ლატენტურობის გზა ჩვენი ფლოტის დანარჩენი ნაწილის იგივე საწარმოო სერვინგის სტეკს დამატებოდა, ამიტომ ის Codex-ში შეუფერხებლად მუშაობს და სამომავლო მოდელების მხარდაჭერისთვის გვამზადებს.

„GPT-5.3-Codex-Spark-ში ყველაზე მეტად გვახარებს OpenAI-სა და დეველოპერთა საზოგადოებასთან პარტნიორობა, რათა აღმოვაჩინოთ, რას ხდის შესაძლებელს სწრაფი ინფერენსი — ურთიერთქმედების ახალი ნიმუშები, გამოყენების ახალი შემთხვევები და ფუნდამენტურად განსხვავებული მოდელის გამოცდილება. ეს პრევიუ მხოლოდ დასაწყისია.“
— Sean Lie, Cerebras-ის CTO და თანადამფუძნებელი

GPU-ები კვლავაც ფუნდამენტურია ჩვენს გაწვრთნისა და ინფერენსის მილსადენებში და ფართო გამოყენებისთვის ყველაზე ეკონომიკურ token-ებს უზრუნველყოფს. Cerebras ამ საფუძველს ავსებს, რადგან განსაკუთრებით ძლიერია სამუშაო ნაკადებში, რომლებიც უკიდურესად დაბალ ლატენტურობას მოითხოვს, ბოლომდე შეკრავს ციკლს და Codex-ს უფრო რეაგირებადს ხდის, როცა იტერაციას გადიხართ. საუკეთესო წარმადობის მისაღწევად GPU-ებისა და Cerebras-ის გაერთიანება ერთ სამუშაო დატვირთვაშიც შეიძლება.

ხელმისაწვდომობა და დეტალები

Codex-Spark დღესვე იწყებს გავრცელებას როგორც კვლევითი პრევიუ ChatGPT Pro მომხმარებლებისთვის Codex აპის, CLI-ისა და VS Code გაფართოების უახლეს ვერსიებში. რადგან ის სპეციალიზებულ, დაბალი ლატენტურობის ჰარდवेयर-ზე მუშაობს, მის გამოყენებას ცალკე rate limit არეგულირებს, რომელიც კვლევითი პრევიუს პერიოდში მოთხოვნის მიხედვით შეიძლება შეიცვალოს. დამატებით, Codex-Spark API-შიც ხელმისაწვდომს ვხდით დიზაინის პარტნიორების მცირე ჯგუფისთვის, რათა გავიგოთ, როგორ სურთ დეველოპერებს Codex-Spark-ის საკუთარ პროდუქტებში ინტეგრირება. მომდევნო კვირებში წვდომას გავაფართოებთ, რადგან რეალურ დატვირთვებზე ჩვენი ინტეგრაციის გამართვას ვაგრძელებთ.

ამჟამად Codex-Spark მხოლოდ ტექსტურია, 128k კონტექსტური ფანჯრით, და ულტრა-სწრაფი მოდელების ოჯახის პირველ წევრს წარმოადგენს. როგორც კი დეველოპერთა საზოგადოებასთან ერთად მეტს ვისწავლით იმის შესახებ, თუ სად ბრწყინავს სწრაფი მოდელები კოდირებაში, კიდევ უფრო მეტ შესაძლებლობას შემოვიტანთ — მათ შორის უფრო დიდ მოდელებს, უფრო გრძელ კონტექსტს და მულტიმოდალურ შეყვანას.

Codex-Spark მოიცავს იმავე უსაფრთხოების გაწვრთნას, რასაც ჩვენი ძირითადი მოდელები, მათ შორის კიბერუსაფრთხოებასთან დაკავშირებულ გაწვრთნას. Codex-Spark შევაფასეთ ჩვენი სტანდარტული გაშვების პროცესის ფარგლებში, რომელიც მოიცავს საბაზისო შეფასებებს კიბერუსაფრთხოებისა და სხვა შესაძლებლობებისთვის, და დავადგინეთ, რომ მას არ აქვს დამაჯერებელი შანსი მიაღწიოს ჩვენი მზაობის ჩარჩოს ზღვარს კიბერუსაფრთხოებაში ან ბიოლოგიაში მაღალი შესაძლებლობისთვის.

რა არის შემდეგი

Codex-Spark პირველი ნაბიჯია ისეთი Codex-ისკენ, რომელსაც ორი ურთიერთშემავსებელი რეჟიმი აქვს: უფრო ხანგრძლივი ჰორიზონტის მსჯელობა და შესრულება, და რეალურ დროში თანამშრომლობა სწრაფი იტერაციისთვის. დროთა განმავლობაში ეს რეჟიმები შეერწყმება ერთმანეთს — Codex შეძლებს მჭიდრო ინტერაქტიულ ციკლში დაგტოვოთ, თან ფონურად ქვე-აგენტებს გადააბაროს უფრო ხანგრძლივი სამუშაო, ან ამოცანები ბევრ მოდელზე პარალელურად გადაანაწილოს, როცა სიგანე და სიჩქარე გჭირდებათ, ასე რომ წინასწარ ერთი რეჟიმის არჩევა აღარ მოგიწევთ.

როგორც მოდელები უფრო ქმედუნარიანი ხდება, ურთიერთქმედების სიჩქარე აშკარა ბოთლის ყელად იქცევა. ულტრა-სწრაფი ინფერენსი ამ ციკლს ამჭიდროებს, Codex-ის გამოყენებას უფრო ბუნებრივს ხდის და აფართოებს შესაძლებლობებს ყველასთვის, ვინც იდეას მუშა პროგრამულად აქცევს.

ავტორი

OpenAI