API клиенттеріне арналған Priority Processing
Priority processing сенімді, жоғары жылдамдықты өнімділікті және пайдалануына қарай төлеу икемділігін ұсынады.
Priority processing таңдағанда, мыналарға қол жеткізесіз:
- Болжамды түрде төмен кідіріс: Priority processing токендерді Standard processing қызметіне қарағанда жылдамырақ және бірқалыптырақ жылдамдықпен шығарады, тіпті сұраныс шегіне жеткен кезде де.
- Пайдалануға оңай икемділік: Standard processing сияқты, Priority processing-ті алдын ала ресурстар бөлуді талап етпей, икемді pay-as-you-go негізінде пайдалануға болады.
| 1M енгізу токеніне шаққандағы баға | 1M кіріс токеніне шаққандағы баға (кэштелген) | 1M шығыс токеніне шаққандағы баға | Жұмысқа қолжетімділік SLA3 | Кідіріс SLA3 | |
|---|---|---|---|---|---|
GPT-5.5 ұзақ контекстті қоспайды1 | 12,50 $ | 1,250 $ | 75,00 $ | 99,9% | 99% > 50 секундына токен2ы |
GPT-5.4 mini ұзақ контекстті қоспайды1 | 1,50 $ | 0,150 $ | 9,00 $ | 99,9% | 99% > 100 секундына токен2ы |
GPT-5.4 ұзақ контекстті қоспайды1 | 5,00 $ | 0,500 $ | 30,00 $ | 99,9% | 99% > 50 секундына токен2ы |
GPT-5.2 ұзақ контекстті қоспайды1 | 3,50 $ | 0,350 $ | 28,00 $ | 99,9% | 99% > 50 секундына токен2ы |
GPT-5.1 ұзақ контекстті қоспайды1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9% | 99% > 50 секундына токен2ы |
GPT-5 ұзақ контекстті қоспайды1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9% | 99% > 50 секундына токен2ы |
GPT-5 mini ұзақ контекстті қоспайды1 | 0,45 $ | 0,045 $ | 3,60 $ | 99,9% | 99% > 80 секундына токен2ы |
GPT-5.1 codex ұзақ контекстті қоспайды1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9% | 99% > 50 секундына токен2ы |
GPT-5 codex ұзақ контекстті қоспайды1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9% | 99% > 50 секундына токен2ы |
GPT-4.1 ұзақ контекстті қоспайды1 | 3,50 $ | 0,875 $ | 14,00 $ | 99,9% | 99% > 80 секундына токен2ы |
GPT-4.1 mini ұзақ контекстті қоспайды1 | 0,70 $ | 0,175 $ | 2,80 $ | 99,9% | 99% > 90 секундына токен2ы |
GPT-4.1 nano ұзақ контекстті қоспайды1 | 0,20 $ | 0,050 $ | 0,80 $ | 99,9% | 99% > 100 секундына токен2ы |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | 4,25 $ | 2,125 $ | 17,00 $ | 99,9% | 99% > 80 секундына токен2ы |
gpt-4o-2024-05-13 | 8,75 $ | — | 26,25 $ | 99,9% | 99% > 80 секундына токен2ы |
GPT-4o mini | 0,25 $ | 0,125 $ | 1,00 $ | 99,9% | 99% > 90 секундына токен2ы |
o3 | 3,50 $ | 0,875 $ | 14,00 $ | 99,9% | 99% > 80 секундына токен2ы |
o4-mini | 2,00 $ | 0,500 $ | 8,00 $ | 99,9% | 99% > 90 секундына токен2ы |
Бұл қалай жұмыс істейді
Клиенттер бар service_tier параметрін пайдаланып, сұрау деңгейінде трафикті Priority processing-ке бағыттай алады, service_tier = «priority» опциясымен.
Priority processing арқылы өңделген токендер токен бойынша есептеледі, бағасы Standard processing тарифтеріне қарағанда жоғарырақ болады.
Сұрау деңгейінде баптаудан бөлек, жобаны да үнсіз келісім бойынша Priority етіп орната аласыз: Project settings → Default Service Tier: Priority. Қажет болса, әр сұрау үшін бәрібір қайта анықтай аласыз.
Шектеулер
- Priority processing мөлшерлеме шектері басқа service tier-лермен ортақ.
- Сирек жағдайларда Priority processing үшін Tokens per Minute көлемінің жылдам өсуі ramp rate limit шегіне жеткізуі мүмкін. Егер ramp rate limit-тен асып кетсеңіз, қосымша трафик оның орнына Standard processing-ке жіберілуі мүмкін.