გადადით მთავარ შინაარსზე
OpenAI

გაიცანით GPT‑5.4 mini და nano

სწრაფი და ეფექტიანი მოდელები, ოპტიმიზებული კოდირებისა და ქვეაგენტებისთვის

იტვირთება…

დღეს ვუშვებთ GPT‑5.4 mini-სა და nano-ს — ჩვენს დღემდე ყველაზე შესაძლებლობიან პატარა მოდელებს. მათ GPT‑5.4‑ის ბევრი ძლიერი მხარე გადააქვთ უფრო სწრაფ და ეფექტიან მოდელებში, რომლებიც მაღალი მოცულობის დატვირთვებისთვისაა შექმნილი.

GPT‑5.4 mini მნიშვნელოვნად აუმჯობესებს GPT‑5 mini-ს კოდირებაში, მსჯელობაში, მულტიმოდალურ გაგებასა და ხელსაწყოების გამოყენებაში, და თან 2-ჯერ მეტად სწრაფად მუშაობს. ის ასევე უახლოვდება უფრო დიდი GPT‑5.4 მოდელის წარმადობას რამდენიმე შეფასებაში, მათ შორის SWE-Bench Pro-სა და OSWorld-Verified-ში.

GPT‑5.4 nano GPT‑5.4‑ის ყველაზე პატარა და იაფი ვერსიაა იმ ამოცანებისთვის, სადაც სიჩქარე და ღირებულება ყველაზე მნიშვნელოვანია. ის ასევე მნიშვნელოვანი გაუმჯობესებაა GPT‑5 nano-სთან შედარებით. მას ვურჩევთ კლასიფიკაციისთვის, მონაცემთა ამოღებისთვის, რანჟირებისთვის და კოდირების ქვეაგენტებისთვის, რომლებიც უფრო მარტივ დამხმარე ამოცანებს ასრულებენ.

ეს მოდელები შექმნილია ისეთი დატვირთვებისთვის, სადაც დაყოვნება პირდაპირ განსაზღვრავს პროდუქტის გამოცდილებას: კოდირების ასისტენტები, რომლებმაც რეაგირებადი უნდა იგრძნონ თავი; ქვეაგენტები, რომლებიც სწრაფად ასრულებენ დამხმარე ამოცანებს; კომპიუტერის გამოყენების სისტემები, რომლებიც ეკრანის სურათებს იღებენ და განმარტავენ; და მულტიმოდალური აპლიკაციები, რომლებსაც გამოსახულებებზე რეალურ დროში მსჯელობა შეუძლიათ. ასეთ გარემოებებში საუკეთესო მოდელი ხშირად ყველაზე დიდი არ არის — ეს არის ის, რომელსაც შეუძლია სწრაფად უპასუხოს, საიმედოდ გამოიყენოს ხელსაწყოები და მაინც კარგად იმუშაოს რთულ პროფესიულ ამოცანებზე.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 GPT‑5 mini-სთვის ხელმისაწვდომი ყველაზე მაღალი reasoning_effort არის 'high'.

აი რას ფიქრობენ ჩვენი მომხმარებლები GPT‑5.4 mini-სა და nano-ს თავიანთ სამუშაო პროცესებში ტესტირების შემდეგ:

„GPT-5.4 mini ამ კლასის მოდელისთვის ძლიერ სრულ ციკლის წარმადობას იძლევა. ჩვენს შეფასებებში მან რამდენიმე output ამოცანასა და citation recall-ში კონკურენტ მოდელებს გაუტოლდა ან გადააჭარბა გაცილებით დაბალ ფასად. მან ასევე მიაღწია უფრო მაღალ end-to-end pass rate-ებს და წყაროების უკეთ ატრიბუციას, ვიდრე უფრო დიდმა GPT-5.4 მოდელმა.“
— Aabhas Sharma, Hebbia-ის CTO

კოდირება

GPT‑5.4 mini და nano განსაკუთრებით ეფექტიანია კოდირების ისეთ სამუშაო პროცესებში, რომლებსაც სწრაფი იტერაცია სჭირდება. მოდელები მცირე დაყოვნებით უმკლავდება მიზნობრივ რედაქტირებას, კოდური ბაზის ნავიგაციას, ფრონტ-ენდის გენერაციასა და დებაგინგის ციკლებს, რაც მათ ძლიერ არჩევანად აქცევს კოდირების ამოცანებისთვის, რომლებიც უფრო სწრაფად და დაბალ ფასად უნდა შესრულდეს.

ბენჩმარკებში GPT‑5.4 mini სტაბილურად აჯობებს GPT‑5‑mini‑ს მსგავს დაყოვნებაზე და უახლოვდება GPT‑5.4‑ის დონის pass rate-ებს ბევრად უფრო სწრაფი მუშაობისას, რაც კოდირების სამუშაო პროცესებისთვის წარმადობასა და დაყოვნებას შორის ერთ-ერთ საუკეთესო ბალანსს იძლევა.

დაყოვნებას ვაფასებთ ჩვენი მოდელების საწარმოო ქცევაზე დაკვირვებით და ამის ოფლაინ სიმულაციით. დაყოვნების შეფასება ითვალისწინებს tool call-ის ხანგრძლივობას (კოდის შესრულების დროს), დასემპლილ token-ებს და შეყვანის token-ებს. რეალურ გარემოში დაყოვნება შეიძლება მნიშვნელოვნად განსხვავდებოდეს და ბევრ ისეთ ფაქტორზეა დამოკიდებული, რომლებიც ჩვენს სიმულაციაში არ არის ასახული. ანალოგიურად, ხარჯები შეფასებულია ამ მოდელების API ფასების მიხედვით ტექსტის დაწერის მომენტში. ხარჯები მომავალში შეიძლება შეიცვალოს. მსჯელობის ძალისხმევის დონეები low-დან xhigh-მდე გამოიცადა.

ქვეაგენტები

GPT‑5.4 mini ასევე ძალიან კარგი არჩევანია სისტემებისთვის, რომლებიც სხვადასხვა ზომის მოდელებს აერთიანებს. მაგალითად, Codex-ში უფრო დიდ მოდელს, როგორიცაა GPT‑5.4, შეუძლია დაგეგმვა, კოორდინაცია და საბოლოო შეფასება იკისროს, ხოლო უფრო ვიწრო ქვეამოცანების შესრულება პარალელურად GPT‑5.4 mini ქვეაგენტებს გადააბაროს — მაგალითად, კოდური ბაზის ძიება, დიდი ფაილის მიმოხილვა ან დამხმარე დოკუმენტების დამუშავება. გაიგეთ, როგორ მუშაობს ქვეაგენტები Codex-ში, დოკუმენტაციაში(იხსნება ახალ ფანჯარაში).

ეს ნიმუში უფრო სასარგებლო ხდება, როცა პატარა მოდელები უფრო სწრაფი და შესაძლებლობიანი ხდება. იმის ნაცვლად, რომ ყველაფერი ერთმა მოდელმა გააკეთოს, დეველოპერებს შეუძლიათ ააგონ სისტემები, სადაც დიდი მოდელები წყვეტს, რა უნდა გაკეთდეს, ხოლო პატარა მოდელები მასშტაბურად და სწრაფად ასრულებს ამ საქმეს. GPT‑5.4 mini ამ ტიპის სამუშაო პროცესისთვის ჩვენი დღემდე ყველაზე ძლიერი mini მოდელია.

კომპიუტერის გამოყენება

GPT‑5.4 mini ასევე ძლიერია მულტიმოდალურ ამოცანებში, განსაკუთრებით კომპიუტერის გამოყენებასთან დაკავშირებულში. მოდელს შეუძლია სწრაფად განმარტოს დატვირთული მომხმარებლის ინტერფეისების ეკრანის სურათები, რათა კომპიუტერის გამოყენების ამოცანები სწრაფად შეასრულოს. OSWorld-Verified-ზე GPT‑5.4 mini უახლოვდება GPT‑5.4‑ს და ამავე დროს მნიშვნელოვნად აჯობებს GPT‑5 mini-ს.

ხელმისაწვდომობა და ფასები

GPT‑5.4 mini დღეს უკვე ხელმისაწვდომია API-ში, Codex-ში და ChatGPT‑ში.

API-ში GPT‑5.4 mini მხარს უჭერს ტექსტისა და სურათის შეყვანას, ხელსაწყოების გამოყენებას, ფუნქციის გამოძახებას, ვებძებნას, ფაილების ძებნას, კომპიუტერის გამოყენებას და უნარებს. მას აქვს 400k კონტექსტური ფანჯარა და ღირს $0.75 თითო 1M შეყვანის token-ზე და $4.50 თითო 1M გამოტანის token-ზე.

Codex-ში GPT‑5.4 mini ხელმისაწვდომია Codex-ის აპში, CLI-ში, IDE გაფართოებაში და ვებზე. ის GPT‑5.4 კვოტის მხოლოდ 30%-ს იყენებს, რაც დეველოპერებს საშუალებას აძლევს Codex-ში უფრო მარტივი კოდირების ამოცანები სწრაფად, დაახლოებით მესამედ ფასად მოაგვარონ. Codex-ს ასევე შეუძლია GPT‑5.4 mini ქვეაგენტებს გადააბაროს ნაკლებად მსჯელობაზე ინტენსიური სამუშაო, რათა ის უფრო იაფ მოდელზე შესრულდეს.

ChatGPT‑ში GPT‑5.4 mini ხელმისაწვდომია Free და Go მომხმარებლებისთვის + მენიუში არსებული “Thinking” ფუნქციით. ყველა სხვა მომხმარებლისთვის GPT‑5.4 mini ხელმისაწვდომია, როგორც rate limit fallback GPT‑5.4 Thinking-ისთვის.

GPT‑5.4 nano ხელმისაწვდომია მხოლოდ API-ში და ღირს $0.20 თითო 1M შეყვანის token-ზე და $1.25 თითო 1M გამოტანის token-ზე.

მოდელების დაცვის მექანიზმებზე მეტი ინფორმაციისთვის, იხილეთ System Card-ის დამატება ჩვენს Deployment Safety Hub-ზე(იხსნება ახალ ფანჯარაში).

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 GPT‑5 mini-სთვის ხელმისაწვდომი ყველაზე მაღალი reasoning_effort არის 'high'.

2 Overall Edit Distance. OmniDocBench გაშვებული იყო reasoning_effort-ის მნიშვნელობით 'none', რათა ასახულიყო დაბალი ღირებულებისა და დაბალი დაყოვნების წარმადობა.

ავტორი

OpenAI