Пређите на главни садржај
OpenAI

Priority Processing za API korisnike

Priority processing nudi pouzdane performanse velike brzine uz fleksibilnost plaćanja po potrošnji.

Izborom Priority processing dobijate:

  • Predvidivo nisku latenciju: Priority processing generiše tokene brže i ujednačenijom brzinom od usluge Standard processing, čak i tokom vršne potražnje.
  • Fleksibilnost laka za korišćenje: Kao i Standard processing, Priority processing je dostupan na fleksibilnoj osnovi plaćanja po potrošnji, bez potrebe za unapred rezervisanim kapacitetom.
Цена по 1 м. улазних токенаЦена за 1 м. улазних токена (кеширана)Цена за 1 м. излазних токенаSLA за доступност система3Кашњење SLA3
GPT-5.5
искључује дуготрајни контекст1
12,50 US$1,250 US$75,00 US$99,9%99% > 50 токена у секунди2
GPT-5.4 mini
искључује дуготрајни контекст1
1,50 US$0,150 US$9,00 US$99,9%99% > 100 токена у секунди2
GPT-5.4
искључује дуготрајни контекст1
5,00 US$0,500 US$30,00 US$99,9%99% > 50 токена у секунди2
GPT-5.2
искључује дуготрајни контекст1
3,50 US$0,350 US$28,00 US$99,9%99% > 50 токена у секунди2
GPT-5.1
искључује дуготрајни контекст1
2,50 US$0,250 US$20,00 US$99,9%99% > 50 токена у секунди2
GPT-5
искључује дуготрајни контекст1
2,50 US$0,250 US$20,00 US$99,9%99% > 50 токена у секунди2
GPT-5 mini
искључује дуготрајни контекст1
0,45 US$0,045 US$3,60 US$99,9%99% > 80 токена у секунди2
GPT-5.1 codex
искључује дуготрајни контекст1
2,50 US$0,250 US$20,00 US$99,9%99% > 50 токена у секунди2
GPT-5 codex
искључује дуготрајни контекст1
2,50 US$0,250 US$20,00 US$99,9%99% > 50 токена у секунди2
GPT-4.1
искључује дуготрајни контекст1
3,50 US$0,875 US$14,00 US$99,9%99% > 80 токена у секунди2
GPT-4.1 mini
искључује дуготрајни контекст1
0,70 US$0,175 US$2,80 US$99,9%99% > 90 токена у секунди2
GPT-4.1 nano
искључује дуготрајни контекст1
0,20 US$0,050 US$0,80 US$99,9%99% > 100 токена у секунди2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
4,25 US$2,125 US$17,00 US$99,9%99% > 80 токена у секунди2
gpt-4o-2024-05-13
8,75 US$26,25 US$99,9%99% > 80 токена у секунди2
GPT-4o mini
0,25 US$0,125 US$1,00 US$99,9%99% > 90 токена у секунди2
o3
3,50 US$0,875 US$14,00 US$99,9%99% > 80 токена у секунди2
o4-mini
2,00 US$0,500 US$8,00 US$99,9%99% > 90 токена у секунди2
1Захтеви процењени на више од 128.000 токена за инструкције
2Обрачунато као p50 кашњење захтева на основу интервала од 5 минута. За клијенте са постојећим уговорима за предузећа који имају SLA-ове за кашњење израчунате као p50 кашњење захтева на минутном нивоу, претходни SLA-ови су и даље применљиви.
3Ово се односи само на клијенте за предузећа

Kako funkcioniše

Korisnici mogu da usmere saobraćaj na Priority processing za svaki pojedinačni zahtev korišćenjem postojećeg parametra service_tier, uz opciju service_tier = „priority”.

Tokeni obrađeni putem Priority processing naplaćuju se po tokenu, po premium ceni u odnosu na cene Standard processing. 

Pored podešavanja na nivou zahteva, projekat možete podrazumevano postaviti na Priority u Project settings → Default Service Tier: Priority. I dalje možete da zamenite to podešavanje po zahtevu.

Ograničenja

  • Ograničenja stope za Priority processing dele se sa drugim nivoima usluge. 
  • U retkim slučajevima, brzo povećanje vaših Tokens per Minute za Priority processing može dovesti do dostizanja ograničenja brzine rasta. Ako prekoračite ograničenje brzine rasta, dodatni saobraćaj može umesto toga biti poslat na Standard processing.

Cene

Modeli

Ograničenja stope

Pouzdanost

Pravila