Scale Tier API მომხმარებლებისთვის
ეს შეთავაზება ხელმისაწვდომია Enterprise მომხმარებლებისთვის. მეტი ინფორმაციისთვის დაუკავშირდით ჩვენს გაყიდვების გუნდს. იმავე პრემიუმ დაყოვნებისა და საიმედოობის უპირატესობებზე მოქნილი, pay-as-you-go საფუძველზე წვდომისთვის იხილეთ Priority processing.
Scale Tier გაძლევთ საშუალებას წინასწარ შეიძინოთ API-ის input და output token-ების განსაზღვრული რაოდენობა წუთში (ცნობილი როგორც “token units”) ერთ კონკრეტულ მოდელის snapshot-ზე წვდომისთვის. თითოეული token unit იყიდება მინიმუმ 30 დღით. დამატებითი მოდელები შეიძლება დაემატოს მომხმარებელთა ინტერესის მიხედვით.
Scale Tier-ის არჩევით, შეგიძლიათ გახსნათ:
- პროგნოზირებადი დაყოვნება: Scale Tier შექმნილია token-ების უფრო სწრაფად და უფრო სტაბილური სიჩქარით გენერირებისთვის, ვიდრე pay-as-you-go (PAYG) სერვისი, პიკური დატვირთვის დროსაც კი.
- შეუზღუდავი მასშტაბირება: Scale Tier-ით შეძენილი ნებისმიერი კვოტა ავტომატურად ემატება თქვენს rate limit-ებს, ასე რომ შეგიძლიათ თავდაჯერებით განაგრძოთ მასშტაბირება.
- უფრო მაღალი საიმედოობა: Scale Tier-ის ტრაფიკი უზრუნველყოფს 99.9% uptime SLA-ს და პრიორიტეტულ გამოთვლით რესურსს.
| შემავალი პაკეტი | გამომავალი შედეგების პაკეტი | SLA-ს უწყვეტი მუშაობის გარანტია | დაყოვნების SLA | |
|---|---|---|---|---|
| GPT-5.5 | 50 000 TPM 750,00 US$ ერთეულზე/დღეში | N/A3 | 99,9% | 99% > 100 ტოკენი წამში2 |
| GPT-5.4 mini | 50 000 TPM 100,00 US$ ერთეულზე/დღეში | N/A3 | 99,9% | 99% > 100 ტოკენი წამში2 |
GPT-5.4 გამორიცხავს გრძელ კონტექსტს4 | 50 000 TPM 300,00 US$ ერთეულზე/დღეში | N/A3 | 99,9% | 99% > 50 ტოკენი წამში2 |
| GPT-5.2 | 25 000 TPM 105,00 US$ ერთეულზე/დღეში | 2500 TPM 84,00 US$ ერთეულზე/დღეში | 99,9% | 99% > 50 ტოკენი წამში2 |
| GPT-5.1 | 25 000 TPM 75,00 US$ ერთეულზე/დღეში | 2500 TPM 60,00 US$ ერთეულზე/დღეში | 99,9% | 99% > 50 ტოკენი წამში2 |
| GPT-5 | 25 000 TPM 75,00 US$ ერთეულზე/დღეში | 2500 TPM 60,00 US$ ერთეულზე/დღეში | 99,9% | 99% > 50 ტოკენი წამში2 |
| GPT-5 mini | 500 000 TPM 275,00 US$ ერთეულზე/დღეში | 50 000 TPM 220,00 US$ ერთეულზე/დღეში | 99,9% | 99% > 80 ტოკენი წამში2 |
GPT-4.1 გამორიცხავს გრძელ კონტექსტს1 | 30,000 TPM 110,00 US$ ერთეულზე/დღეში | 2,500 TPM 36,00 US$ ერთეულზე/დღეში | 99,9% | 99% > 80 ტოკენი წამში2 |
GPT-4.1 mini გამორიცხავს გრძელ კონტექსტს1 | 500,000 TPM 450,00 US$ ერთეულზე/დღეში | 50,000 TPM 175,00 US$ ერთეულზე/დღეში | 99,9% | 99% > 90 ტოკენი წამში2 |
GPT-4.1 nano გამორიცხავს გრძელ კონტექსტს1 | 500,000 TPM 110,00 US$ ერთეულზე/დღეში | 50,000 TPM 40,00 US$ ერთეულზე/დღეში | 99,9% | 99% > 100 ტოკენი წამში2 |
| GPT-4.1 fine tuning | 30,000 TPM 165,00 US$ ერთეულზე/დღეში | 2,500 TPM 36,00 US$ ერთეულზე/დღეში | 99,9% | 99% > 80 ტოკენი წამში2 |
| GPT-4.1 mini fine tuning | 500,000 TPM 900,00 US$ ერთეულზე/დღეში | 50,000 TPM 175,00 US$ ერთეულზე/დღეში | 99,9% | 99% > 90 ტოკენი წამში2 |
| o3 | 25 000 TPM 75,00 US$ ერთეულზე/დღეში | 5000 TPM 60,00 US$ ერთეულზე/დღეში | 99,9% | 99% > 80 ტოკენი წამში2 |
| o4-mini | 30 000 TPM 50,00 US$ ერთეულზე/დღეში | 5000 TPM 32,50 US$ ერთეულზე/დღეში | 99,9% | 99% > 90 ტოკენი წამში2 |
| GPT-4o | 30,000 TPM 124,59 US$ ერთეულზე/დღეში | 2,500 TPM 39,34 US$ ერთეულზე/დღეში | 99,9% | 99% > 80 ტოკენი წამში2 |
| GPT-4o mini | 500,000 TPM 114,75 US$ ერთეულზე/დღეში | 50,000 TPM 49,18 US$ ერთეულზე/დღეში | 99,9% | 99% > 90 ტოკენი წამში2 |
| GPT-4o mini fine tuning | 500,000 TPM 229,50 US$ ერთეულზე/დღეში | 50,000 TPM 98,36 US$ ერთეულზე/დღეში | 99,9% | 99% > 90 ტოკენი წამში2 |
| o1 | 5000 TPM 163,93 US$ ერთეულზე/დღეში | 1000 TPM 131,15 US$ ერთეულზე/დღეში | 99,9% | 99% > 80 ტოკენი წამში2 |
| o3-mini | 30 000 TPM 78,69 US$ ერთეულზე/დღეში | 5000 TPM 52,46 US$ ერთეულზე/დღეში | 99,9% | 99% > 90 ტოკენი წამში2 |
როგორ მუშაობს
Scale Tier-ით შეგიძლიათ შეიძინოთ input და output token unit-ები. მაგალითად, GPT‑4.1‑ით თითოეული input unit ღირს $110/დღე და გაძლევთ უფლებას 30k input token/წთ-ზე. თითოეული output unit ღირს $36/დღე და გაძლევთ უფლებას 2.5k output token/წთ-ზე. თითოეული token unit იყიდება მინიმუმ 30 დღით.
დამატებითი ინფორმაცია იმის შესახებ, თუ როგორ ურთიერთქმედებს Scale Tier Prompt Caching-თან, შეგიძლიათ იხილოთ ქვემოთ FAQ სექციაში.
GPT‑5.4‑ით ყიდულობთ Combined Input and Output tokens/min-ს. ეს გაძლევთ მეტ მოქნილობას და ხსნის input და output token-ების თანაფარდობის წინასწარ პროგნოზირების საჭიროებას. Scale Tier-ის გამოყენებისას token-ებს თქვენს Combined Tokens-ს ასე ვითვლით:
- Input token-ები ითვლება როგორც 1
- Cached input token-ები მიჰყვება თითოეული მოდელის caching-ს, როგორც ქვემოთ FAQ სექციაშია აღწერილი
- Output token-ები ითვლება მოდელისთვის Output-ისა და Input token-ების PayG ფასის თანაფარდობის მიხედვით. მაგალითად, GPT‑5.4‑ით ერთი output token ითვლება როგორც 6.


