Ipproċessar bi Prijorità għall-Klijenti tal-API
L-ipproċessar bi prijorità joffri prestazzjoni affidabbli u b’veloċità għolja bil-flessibbiltà li tħallas skont l-użu.
Billi tagħżel l-ipproċessar bi prijorità, tista’ tikseb:
- Latenza baxxa prevedibbli: L-ipproċessar bi prijorità jiġġenera tokens aktar malajr u b’veloċità aktar konsistenti mis-servizz tal-ipproċessar Standard, anke waqt domanda massima.
- Flessibbiltà faċli biex tużaha: Bħall-ipproċessar Standard, l-ipproċessar bi prijorità jista’ jiġi aċċessat fuq bażi flessibbli, pay-as-you-go, minflok ma jeħtieġ provvista minn qabel.
| Prezz għal kull 1M token tal-input | Prezz għal kull 1M token tal-input (cached) | Prezz għal kull 1M token tal-produzzjoni | SLA tal-ħin ta' tħaddim3 | SLA tal-latenza3 | |
|---|---|---|---|---|---|
GPT-5.5 jeskludi l-kuntesttwil1 | US$12.50 | US$1.250 | US$75.00 | 99.9% | 99% > 50 tokens kull sekonda2 |
GPT-5.4 mini jeskludi l-kuntesttwil1 | US$1.50 | US$0.150 | US$9.00 | 99.9% | 99% > 100 tokens kull sekonda2 |
GPT-5.4 jeskludi l-kuntesttwil1 | US$5.00 | US$0.500 | US$30.00 | 99.9% | 99% > 50 tokens kull sekonda2 |
GPT-5.2 jeskludi l-kuntesttwil1 | US$3.50 | US$0.350 | US$28.00 | 99.9% | 99% > 50 tokens kull sekonda2 |
GPT-5.1 jeskludi l-kuntesttwil1 | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 tokens kull sekonda2 |
GPT-5 jeskludi l-kuntesttwil1 | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 tokens kull sekonda2 |
GPT-5 mini jeskludi l-kuntesttwil1 | US$0.45 | US$0.045 | US$3.60 | 99.9% | 99% > 80 tokens kull sekonda2 |
GPT-5.1 codex jeskludi l-kuntesttwil1 | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 tokens kull sekonda2 |
GPT-5 codex jeskludi l-kuntesttwil1 | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 tokens kull sekonda2 |
GPT-4.1 jeskludi l-kuntesttwil1 | US$3.50 | US$0.875 | US$14.00 | 99.9% | 99% > 80 tokens kull sekonda2 |
GPT-4.1 mini jeskludi l-kuntesttwil1 | US$0.70 | US$0.175 | US$2.80 | 99.9% | 99% > 90 tokens kull sekonda2 |
GPT-4.1 nano jeskludi l-kuntesttwil1 | US$0.20 | US$0.050 | US$0.80 | 99.9% | 99% > 100 tokens kull sekonda2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | US$4.25 | US$2.125 | US$17.00 | 99.9% | 99% > 80 tokens kull sekonda2 |
gpt-4o-2024-05-13 | US$8.75 | — | US$26.25 | 99.9% | 99% > 80 tokens kull sekonda2 |
GPT-4o mini | US$0.25 | US$0.125 | US$1.00 | 99.9% | 99% > 90 tokens kull sekonda2 |
o3 | US$3.50 | US$0.875 | US$14.00 | 99.9% | 99% > 80 tokens kull sekonda2 |
o4-mini | US$2.00 | US$0.500 | US$8.00 | 99.9% | 99% > 90 tokens kull sekonda2 |
Kif jaħdem
Il-klijenti jistgħu jidderieġu t-traffiku lejn l-ipproċessar bi prijorità fuq bażi ta’ kull talba billi jużaw il-parametru eżistenti service_tier, bl-għażla service_tier = “priority”.
It-tokens servuti bl-ipproċessar bi prijorità se jiġu fatturati fuq bażi ta’ kull token, bi prezz premium relattiv għar-rati tal-ipproċessar Standard.
Minbarra li jiġi kkonfigurat fil-livell tat-talba, tista’ wkoll tagħmel project default għal Priority fis-settings tal-Project → Default Service Tier: Priority. Xorta tista’ tagħmel override għal kull talba.
Limitazzjonijiet
- Il-limiti tar-rata tal-ipproċessar bi prijorità huma maqsuma ma’ service tiers oħra.
- F’każijiet rari, żidiet rapidi fit-Tokens per Minute tal-ipproċessar bi prijorità tiegħek jistgħu jwasslu biex jintlaħqu l-limiti tar-rampa. Jekk taqbeż il-limitu tar-rampa, allura traffiku addizzjonali jista’ jintbagħat għall-ipproċessar Standard minflok.