Aqbeż għall-kontenut prinċipali
OpenAI

Ipproċessar bi Prijorità għall-Klijenti tal-API

L-ipproċessar bi prijorità joffri prestazzjoni affidabbli u b’veloċità għolja bil-flessibbiltà li tħallas skont l-użu.

Billi tagħżel l-ipproċessar bi prijorità, tista’ tikseb:

  • Latenza baxxa prevedibbli: L-ipproċessar bi prijorità jiġġenera tokens aktar malajr u b’veloċità aktar konsistenti mis-servizz tal-ipproċessar Standard, anke waqt domanda massima.
  • Flessibbiltà faċli biex tużaha: Bħall-ipproċessar Standard, l-ipproċessar bi prijorità jista’ jiġi aċċessat fuq bażi flessibbli, pay-as-you-go, minflok ma jeħtieġ provvista minn qabel.
Prezz għal kull 1M token tal-inputPrezz għal kull 1M token tal-input (cached)Prezz għal kull 1M token tal-produzzjoniSLA tal-ħin ta' tħaddim3SLA tal-latenza3
GPT-5.5
jeskludi l-kuntesttwil1
US$12.50US$1.250US$75.0099.9%99% > 50 tokens kull sekonda2
GPT-5.4 mini
jeskludi l-kuntesttwil1
US$1.50US$0.150US$9.0099.9%99% > 100 tokens kull sekonda2
GPT-5.4
jeskludi l-kuntesttwil1
US$5.00US$0.500US$30.0099.9%99% > 50 tokens kull sekonda2
GPT-5.2
jeskludi l-kuntesttwil1
US$3.50US$0.350US$28.0099.9%99% > 50 tokens kull sekonda2
GPT-5.1
jeskludi l-kuntesttwil1
US$2.50US$0.250US$20.0099.9%99% > 50 tokens kull sekonda2
GPT-5
jeskludi l-kuntesttwil1
US$2.50US$0.250US$20.0099.9%99% > 50 tokens kull sekonda2
GPT-5 mini
jeskludi l-kuntesttwil1
US$0.45US$0.045US$3.6099.9%99% > 80 tokens kull sekonda2
GPT-5.1 codex
jeskludi l-kuntesttwil1
US$2.50US$0.250US$20.0099.9%99% > 50 tokens kull sekonda2
GPT-5 codex
jeskludi l-kuntesttwil1
US$2.50US$0.250US$20.0099.9%99% > 50 tokens kull sekonda2
GPT-4.1
jeskludi l-kuntesttwil1
US$3.50US$0.875US$14.0099.9%99% > 80 tokens kull sekonda2
GPT-4.1 mini
jeskludi l-kuntesttwil1
US$0.70US$0.175US$2.8099.9%99% > 90 tokens kull sekonda2
GPT-4.1 nano
jeskludi l-kuntesttwil1
US$0.20US$0.050US$0.8099.9%99% > 100 tokens kull sekonda2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
US$4.25US$2.125US$17.0099.9%99% > 80 tokens kull sekonda2
gpt-4o-2024-05-13
US$8.75US$26.2599.9%99% > 80 tokens kull sekonda2
GPT-4o mini
US$0.25US$0.125US$1.0099.9%99% > 90 tokens kull sekonda2
o3
US$3.50US$0.875US$14.0099.9%99% > 80 tokens kull sekonda2
o4-mini
US$2.00US$0.500US$8.0099.9%99% > 90 tokens kull sekonda2
1Talbiet stmati għal aktar minn 128K token tal-prompt
2Ikkalkulat bħala latenza tat-talbiet p50 fuq bażi ta’ kull 5 minuti. Għall-klijenti b’ftehimiet eżistenti tal-intrapriża li għandhom latency SLAs ikkalkulati bħala latenza tat-talba p50 fuq bażi ta’ kull minuta, l-SLAs preċedenti għadhom japplikaw ukoll.
3Dan japplika għall-klijenti tal-Intrapriża biss

Kif jaħdem

Il-klijenti jistgħu jidderieġu t-traffiku lejn l-ipproċessar bi prijorità fuq bażi ta’ kull talba billi jużaw il-parametru eżistenti service_tier, bl-għażla service_tier = “priority”.

It-tokens servuti bl-ipproċessar bi prijorità se jiġu fatturati fuq bażi ta’ kull token, bi prezz premium relattiv għar-rati tal-ipproċessar Standard. 

Minbarra li jiġi kkonfigurat fil-livell tat-talba, tista’ wkoll tagħmel project default għal Priority fis-settings tal-Project → Default Service Tier: Priority. Xorta tista’ tagħmel override għal kull talba.

Limitazzjonijiet

  • Il-limiti tar-rata tal-ipproċessar bi prijorità huma maqsuma ma’ service tiers oħra. 
  • F’każijiet rari, żidiet rapidi fit-Tokens per Minute tal-ipproċessar bi prijorità tiegħek jistgħu jwasslu biex jintlaħqu l-limiti tar-rampa. Jekk taqbeż il-limitu tar-rampa, allura traffiku addizzjonali jista’ jintbagħat għall-ipproċessar Standard minflok.

Prezzijiet

Mudelli

Limiti tar-rata

Affidabbiltà

Politiki