Priority Processing za API korisnike
Priority processing nudi pouzdane performanse velike brzine uz fleksibilnost plaćanja po potrošnji.
Izborom Priority processing dobijate:
- Predvidivo nisku latenciju: Priority processing generiše tokene brže i ujednačenijom brzinom od usluge Standard processing, čak i tokom vršne potražnje.
- Fleksibilnost laka za korišćenje: Kao i Standard processing, Priority processing je dostupan na fleksibilnoj osnovi plaćanja po potrošnji, bez potrebe za unapred rezervisanim kapacitetom.
| Цена по 1 м. улазних токена | Цена за 1 м. улазних токена (кеширана) | Цена за 1 м. излазних токена | SLA за доступност система3 | Кашњење SLA3 | |
|---|---|---|---|---|---|
GPT-5.5 искључује дуготрајни контекст1 | 12,50 US$ | 1,250 US$ | 75,00 US$ | 99,9% | 99% > 50 токена у секунди2 |
GPT-5.4 mini искључује дуготрајни контекст1 | 1,50 US$ | 0,150 US$ | 9,00 US$ | 99,9% | 99% > 100 токена у секунди2 |
GPT-5.4 искључује дуготрајни контекст1 | 5,00 US$ | 0,500 US$ | 30,00 US$ | 99,9% | 99% > 50 токена у секунди2 |
GPT-5.2 искључује дуготрајни контекст1 | 3,50 US$ | 0,350 US$ | 28,00 US$ | 99,9% | 99% > 50 токена у секунди2 |
GPT-5.1 искључује дуготрајни контекст1 | 2,50 US$ | 0,250 US$ | 20,00 US$ | 99,9% | 99% > 50 токена у секунди2 |
GPT-5 искључује дуготрајни контекст1 | 2,50 US$ | 0,250 US$ | 20,00 US$ | 99,9% | 99% > 50 токена у секунди2 |
GPT-5 mini искључује дуготрајни контекст1 | 0,45 US$ | 0,045 US$ | 3,60 US$ | 99,9% | 99% > 80 токена у секунди2 |
GPT-5.1 codex искључује дуготрајни контекст1 | 2,50 US$ | 0,250 US$ | 20,00 US$ | 99,9% | 99% > 50 токена у секунди2 |
GPT-5 codex искључује дуготрајни контекст1 | 2,50 US$ | 0,250 US$ | 20,00 US$ | 99,9% | 99% > 50 токена у секунди2 |
GPT-4.1 искључује дуготрајни контекст1 | 3,50 US$ | 0,875 US$ | 14,00 US$ | 99,9% | 99% > 80 токена у секунди2 |
GPT-4.1 mini искључује дуготрајни контекст1 | 0,70 US$ | 0,175 US$ | 2,80 US$ | 99,9% | 99% > 90 токена у секунди2 |
GPT-4.1 nano искључује дуготрајни контекст1 | 0,20 US$ | 0,050 US$ | 0,80 US$ | 99,9% | 99% > 100 токена у секунди2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | 4,25 US$ | 2,125 US$ | 17,00 US$ | 99,9% | 99% > 80 токена у секунди2 |
gpt-4o-2024-05-13 | 8,75 US$ | — | 26,25 US$ | 99,9% | 99% > 80 токена у секунди2 |
GPT-4o mini | 0,25 US$ | 0,125 US$ | 1,00 US$ | 99,9% | 99% > 90 токена у секунди2 |
o3 | 3,50 US$ | 0,875 US$ | 14,00 US$ | 99,9% | 99% > 80 токена у секунди2 |
o4-mini | 2,00 US$ | 0,500 US$ | 8,00 US$ | 99,9% | 99% > 90 токена у секунди2 |
Kako funkcioniše
Korisnici mogu da usmere saobraćaj na Priority processing za svaki pojedinačni zahtev korišćenjem postojećeg parametra service_tier, uz opciju service_tier = „priority”.
Tokeni obrađeni putem Priority processing naplaćuju se po tokenu, po premium ceni u odnosu na cene Standard processing.
Pored podešavanja na nivou zahteva, projekat možete podrazumevano postaviti na Priority u Project settings → Default Service Tier: Priority. I dalje možete da zamenite to podešavanje po zahtevu.
Ograničenja
- Ograničenja stope za Priority processing dele se sa drugim nivoima usluge.
- U retkim slučajevima, brzo povećanje vaših Tokens per Minute za Priority processing može dovesti do dostizanja ograničenja brzine rasta. Ako prekoračite ograničenje brzine rasta, dodatni saobraćaj može umesto toga biti poslat na Standard processing.