メインコンテンツにスキップ
OpenAI

API のお客様を対象としたスケールティア

スケールティアにより、お客様はひとつの専用モデルのスナップショットにアクセスするため、設定された1分あたりの API 入出力トークン数(「トークン単位」)を前払いで購入できます。各トークン単位の購入下限は30日間となります。

スケールティアを選択すると、以下のメリットが得られます。

  • 遅延の予測が可能:スケールティアは、需要ピーク時であっても、従量課金制のサービスよりもトークンを速やかに、かつより一定の速度で生成することを目的としています。
  • スケールに上限がない:スケールティアで購入するクォータは、レート制限に自動追加されるため、不安なくさらなるスケールを行うことができます。 
  • 高い信頼性:スケールティアのトラフィックは、99.9%の稼働率の SLA と優先的な計算を提供します。
入力バンドル出力バンドル稼働率の SLAレイテンシ SLA
GPT-4.1
long-context を除く1
30,000 TPM
$110.00 /1日あたりのユニット
2,500 TPM
$36.00 /1日あたりのユニット
99.9%99% > 40 トークン/秒2
GPT-4.1 mini
long-context を除く1
500,000 TPM
$450.00 /1日あたりのユニット
50,000 TPM
$175.00 /1日あたりのユニット
99.9%99% > 50 トークン/秒2
GPT-4.1 nano
long-context を除く1
500,000 TPM
1日あたり1ユニットにつき $110.00
500,000 TPM
1日あたり1ユニットにつき $40.00
99.9%99% > 60 トークン/秒2
o35,000 TPM
$75.00 /1日あたりのユニット
1,000 TPM
$60.00 /1日あたりのユニット
99.9%99% > 40 トークン/秒2
o4-mini30,000 TPM
$50.00 /1日あたりのユニット
5,000 TPM
$32.50 /1日あたりのユニット
99.9%99% > 66 トークン/秒2
GPT-4o30,000 TPM
$124.59 /1日あたりのユニット
2,500 TPM
$39.34 /1日あたりのユニット
99.9%99% > 25 トークン/秒2
GPT-4o mini500,000 TPM
$114.75 /1日あたりのユニット
50,000 TPM
$49.18 /1日あたりのユニット
99.9%99% > 33 トークン/秒2
GPT-4o mini fine tuning500,000 TPM
$229.50 /1日あたりのユニット
50,000 TPM
$98.36 /1日あたりのユニット
99.9%99% > 33 トークン/秒2
o15,000 TPM
$163.93 /1日あたりのユニット
1,000 TPM
$131.15 /1日あたりのユニット
99.9%99% > 25 トークン/秒2
o3-mini30,000 TPM
$78.69 /1日あたりのユニット
5,000 TPM
$52.46 /1日あたりのユニット
99.9%99% > 66 トークン/秒2
1128,000以上のプロンプト トークンでの推定リクエスト
21か月のリクエストの平均遅延時間(1分あたり)として計算

仕組み

スケールティアを利用することで、入出力トークンをトークン単位で購入できます。たとえば、GPT‑4o の各入力トークン単位の料金は$3,800で、1分あたり3万トークンの処理が可能となります。各出力トークン単位は$1,200で、1分あたり2,500トークンの処理が可能となります。1分間に処理するトークン数が割り当てられた TPM を超えると、超過分のリクエストが共有容量を使用して処理され、従量課金制の料金で請求されます。

スケールティアとプロンプトキャッシュの関連性についての詳細は、以下のよくあるご質問セクションを参照してください。

1分あたりのトークン数TPM使用トークン単位の支払い19トークン/秒99.5%従量課金制平均レイテンシアップタイムティア入力出力Before毎月前払い19トークン/秒25トークン/秒99.5%99.9%従量課金制スケール平均レイテンシアップタイムティア入力3ユニット出力2ユニットAfter

料金

注文書に署名すると、開発者コンソール(新しいウィンドウで開く)経由でトークン単位を追加・削除できます。

トークン単位とレート制限

お使いのアカウントでスケールティアを有効に設定後、トークン単位を手動で調整できます。

モデル

スケールティアは、共有の GPT‑4o および GPT‑4o mini と同じマルチモーダル機能に対応しています。特に、スケールティアへの入力として画像を使用でき、画像は同じ短い遅延で処理されます。

信頼性

スケールティアのトークン単位を購入した月のレイテンシーの SLA と稼働率の SLA のうち、いずれか大きい金額が返金されます。

ポリシー

ゼロデータ保持(ZDR)の要件を満たすユースケースがある場合、お客様のスケールティアの利用は、同じ保持ポリシーの対象となります。