Негізгі мазмұнға өту
OpenAI

API клиенттеріне арналған Priority Processing

Priority processing сенімді, жоғары жылдамдықты өнімділікті және пайдалануына қарай төлеу икемділігін ұсынады.

Priority processing таңдағанда, мыналарға қол жеткізесіз:

  • Болжамды түрде төмен кідіріс: Priority processing токендерді Standard processing қызметіне қарағанда жылдамырақ және бірқалыптырақ жылдамдықпен шығарады, тіпті сұраныс шегіне жеткен кезде де.
  • Пайдалануға оңай икемділік: Standard processing сияқты, Priority processing-ті алдын ала ресурстар бөлуді талап етпей, икемді pay-as-you-go негізінде пайдалануға болады.
1M енгізу токеніне шаққандағы баға1M кіріс токеніне шаққандағы баға (кэштелген)1M шығыс токеніне шаққандағы бағаЖұмысқа қолжетімділік SLA3Кідіріс SLA3
GPT-5.5
ұзақ контекстті қоспайды1
12,50 $1,250 $75,00 $99,9%99% > 50 секундына токен2ы
GPT-5.4 mini
ұзақ контекстті қоспайды1
1,50 $0,150 $9,00 $99,9%99% > 100 секундына токен2ы
GPT-5.4
ұзақ контекстті қоспайды1
5,00 $0,500 $30,00 $99,9%99% > 50 секундына токен2ы
GPT-5.2
ұзақ контекстті қоспайды1
3,50 $0,350 $28,00 $99,9%99% > 50 секундына токен2ы
GPT-5.1
ұзақ контекстті қоспайды1
2,50 $0,250 $20,00 $99,9%99% > 50 секундына токен2ы
GPT-5
ұзақ контекстті қоспайды1
2,50 $0,250 $20,00 $99,9%99% > 50 секундына токен2ы
GPT-5 mini
ұзақ контекстті қоспайды1
0,45 $0,045 $3,60 $99,9%99% > 80 секундына токен2ы
GPT-5.1 codex
ұзақ контекстті қоспайды1
2,50 $0,250 $20,00 $99,9%99% > 50 секундына токен2ы
GPT-5 codex
ұзақ контекстті қоспайды1
2,50 $0,250 $20,00 $99,9%99% > 50 секундына токен2ы
GPT-4.1
ұзақ контекстті қоспайды1
3,50 $0,875 $14,00 $99,9%99% > 80 секундына токен2ы
GPT-4.1 mini
ұзақ контекстті қоспайды1
0,70 $0,175 $2,80 $99,9%99% > 90 секундына токен2ы
GPT-4.1 nano
ұзақ контекстті қоспайды1
0,20 $0,050 $0,80 $99,9%99% > 100 секундына токен2ы
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
4,25 $2,125 $17,00 $99,9%99% > 80 секундына токен2ы
gpt-4o-2024-05-13
8,75 $26,25 $99,9%99% > 80 секундына токен2ы
GPT-4o mini
0,25 $0,125 $1,00 $99,9%99% > 90 секундына токен2ы
o3
3,50 $0,875 $14,00 $99,9%99% > 80 секундына токен2ы
o4-mini
2,00 $0,500 $8,00 $99,9%99% > 90 секундына токен2ы
1Сұраныстар >128K көмексөз токендерге бағаланды
2Әр 5 минут сайын p50 сұрау кідірісі ретінде есептеледі. Кідіріс SLA-лары минут сайынғы негізде p50 сұрау кідірісі ретінде есептелетін қолданыстағы enterprise келісімдері бар тұтынушылар үшін бұрынғы SLA-лар да қолданылады.
3Бұл тек кәсіпорын тұтынушыларына ғана қолданылады

Бұл қалай жұмыс істейді

Клиенттер бар service_tier параметрін пайдаланып, сұрау деңгейінде трафикті Priority processing-ке бағыттай алады, service_tier = «priority» опциясымен.

Priority processing арқылы өңделген токендер токен бойынша есептеледі, бағасы Standard processing тарифтеріне қарағанда жоғарырақ болады. 

Сұрау деңгейінде баптаудан бөлек, жобаны да үнсіз келісім бойынша Priority етіп орната аласыз: Project settings → Default Service Tier: Priority. Қажет болса, әр сұрау үшін бәрібір қайта анықтай аласыз.

Шектеулер

  • Priority processing мөлшерлеме шектері басқа service tier-лермен ортақ. 
  • Сирек жағдайларда Priority processing үшін Tokens per Minute көлемінің жылдам өсуі ramp rate limit шегіне жеткізуі мүмкін. Егер ramp rate limit-тен асып кетсеңіз, қосымша трафик оның орнына Standard processing-ке жіберілуі мүмкін.

Бағалар

Модельдер

Мөлшерлеме шектері

Сенімділік

Саясаттар