新しい埋め込みモデルと API の更新
新世代の埋め込みモデル、新しい GPT‑4 Turbo とモデレーションモデル、新しい API 使用管理ツールを公開し、後に GPT‑3.5 Turbo を値下げします。

新しいモデルをリリースし、GPT‑3.5 Turbo を値下げするほか、開発者が API キーを管理し、API の使用状況を把握するための新しい方法を発表します。新モデルの内容はこちらです。
- 2つの新しい埋め込みモデル
- GPT‑4 Turbo の更新版プレビューモデル
- GPT‑3.5 Turbo の更新版モデル
- 更新版テキストモデレーションモデル
デフォルトでは、OpenAI API に送信されるデータは、OpenAI モデルの学習や改良には使用されません。
2つの新しい埋め込みモデルを発表します。小さく高効率な text-embedding-3-small
モデルと、大きく強力な text-embedding-3-large
モデルです。
埋め込みとは、自然言語やコードなどのコンテンツ内で概念を表す数列のことです。埋め込みは、機械学習モデルなどのアルゴリズムがコンテンツ間の関係を理解し、クラスタリングや検索などのタスクを実行することを容易にします。ChatGPT と Assistants API、多くの検索拡張生成(RAG)開発者ツールの知識検索といったアプリケーションを駆動しています。
text-embedding-3-small
は、当社の新しい高効率な埋め込みモデルであり、2022年12月にリリースされた前身の text-embedding-ada-002
モデルから大幅なアップグレードを提供します。
より高性能。text-embedding-ada-002
と text-embedding-3-small
を比較すると、多言語検索でよく用いられるベンチマーク(MIRACL(新しいウィンドウで開く))の平均スコアは31.4%から44.0%に向上し、英語タスクでよく用いられるベンチマーク(MTEB(新しいウィンドウで開く))の平均スコアは61.0%から62.3%に向上しています。
低料金化。text-embedding-3-small
は、前世代の text-embedding-ada-002
モデルよりも大幅に効率化しています。そのため、text-embedding-3-small
の料金は、text-embedding-ada-002
と比べて1/5となり、1000トークンあたり0.0001ドルから0.00002ドルになりました。
text-embedding-ada-002
は廃止予定ではないため、新しいモデルを推奨しますが、前世代のモデルを引き続き利用することもできます。
新しい大型テキスト埋め込みモデル:text-embedding-3-large
text-embedding-3-large
は、新しい次世代の大型埋め込みモデルで、最大3072ディメンションの埋め込みを作成します。
性能強化。text-embedding-3-large
は、新しいベストパフォーマンスモデルです。text-embedding-ada-002
と text-embedding-3-large
を比較すると、MIRACL では平均スコアが31.4%から54.9%に、MTEB では平均スコアが61.0%から64.6%に向上しています。
評価ベンチマーク | ada v2 | text-embedding-3-small | text-embedding-3-large |
MIRACL 平均 | 31.4 | 44.0 | 54.9 |
MTEB 平均 | 61.0 | 62.3 | 64.6 |
text-embedding-3-large
の料金は1000トークンあたり$0.00013となります。
新しい埋め込みモデルの使い方について詳しくは、埋め込みガイド(新しいウィンドウで開く)をご覧ください。
ベクターストアに保存して検索する場合など、より大きな埋め込みを使用する場合は、一般的に、小型の埋め込みを使用するよりもコストがかかり、より多くの計算、メモリ、ストレージを消費します。
当社の新しい埋め込みモデルは、いずれも開発者が埋め込みを使用する際の性能とコストを釣り合わせられるようにする手法Aで学習を行っています。具体的には、dimensions
API パラメーターを渡すことで、埋め込みがその概念を表す特性を失うことなく埋め込みを短縮できます(シーケンスの末尾からいくつかの数字を削除)。例えば、MTEB ベンチマークでは、text-embedding-3-large
埋め込みを256サイズに短縮しても、1536サイズの短縮されていない text-embedding-ada-002
埋め込みの性能を上回ることができます。
これで非常に柔軟な使い方が可能になります。例えば、1024ディメンションまでの埋め込みしかサポートしていないベクターデータストアを使用する場合、開発者は最適な埋め込みモデル text-embedding-3-large
を使用し、dimensions
API パラメーターに1024を指定することで、埋め込みを3072ディメンションから短縮し、精度と引き換えにベクターサイズを小型化できます。
来週、GPT‑3.5 Turbo の新モデルである gpt-3.5-turbo-0125
を発表します。また、過去1年間で3度目となる GPT‑3.5 Turbo の値下げを行い、お客様の規模拡大を支援します。新モデルの入力料金は50%引き下げられて1000トークンあたり0.0005ドルに、出力料金は25%引き下げられて1000トークンあたり0.0015ドルになります。このモデルには、要求されたフォーマットでの応答精度の向上や、英語以外の言語の関数呼び出しでテキストエンコーディングの問題を起こしていたバグ(新しいウィンドウで開く)修正など、さまざまな改良を行います。
固定されていない gpt-3.5-turbo
モデルエイリアスを使用しているお客様は、このモデルの開始から2週間後に gpt-3.5-turbo-0613
から gpt-3.5-turbo-0125
に自動的にアップグレードされます。
リリース以来、GPT‑4 API のお客様からの要求のうち70%以上が GPT‑4 Turbo に移行しています。開発者が更新されたナレッジカットオフ、より大きな128kのコンテキストウィンドウ、低料金を利用できることが要因です。
本日、GPT‑4 Turbo プレビューモデルの更新版である gpt-4-0125-preview
をリリースします。このモデルは、以前のプレビューモデルよりもコード生成などのタスクをより徹底的に実行し、モデルがタスクを完了しない「怠慢」のケースを減らすことを意図しています。新モデルには、英語以外の UTF-8 世代に影響するバグの修正も含まれています。
GPT‑4 Turbo プレビューの新バージョンに自動的にアップグレードされたい方のために、新しい gpt-4-turbo-preview
モデル名のエイリアスを導入し、これが常に最新の GPT‑4 Turbo プレビューモデルを指すようにしました。
GPT‑4 Turbo は、今後の数か月間で一般公開する予定です。
無料の Moderation API により、開発者は有害な可能性のあるテキストを特定できます。継続的な安全対策の一環として、これまでで最も堅牢なモデレーションモデルである text-moderation-007
をリリースします。text-moderation-latest
および text-moderation-stable
エイリアスがこれを指すように更新されました。安全な AI システムの構築について詳しくは、安全性ベストプラクティスガイド(新しいウィンドウで開く)をご覧ください。
開発者が API キーの使用状況をより把握し、管理できるようにするため、2つのプラットフォームの改良を実施します。
まず、開発者は API キーのページ(新しいウィンドウで開く)から API キーに権限を割り当てることができるようになりました。例えば、内部追跡ダッシュボードを実行するためにキーに読み取り専用アクセスを割り当てたり、特定のエンドポイントにのみアクセスできるよう制限したりできます。
次に、使用状況ダッシュボードと使用状況のエクスポート機能は、トラッキングをオン(新しいウィンドウで開く)にした後、API キーレベルで指標を表示するようになりました。このため、機能、チームごと、プロダクト、プロジェクトごとに別々の API キーを用意するだけで、簡単に使用状況を見ることができます。

今後数か月間に、特に大規模な組織において開発者が API の使用状況を確認したり API キーを管理したりする機能をさらに改良する予定です。
OpenAI の API の最新情報については、X で @OpenAIDevs(新しいウィンドウで開く) をフォローしてください。
著者
OpenAI謝辞
Juntang Zhuang、Paul Baltescu、Joy Jiao、Arvind Neelakantan、Andrew Braunstein、Jeff Harris、Logan Kilpatrick、Leher Pathak、Enoch Cheung、Ted Sanders、Yutian Liu、Anushree Agrawal、Andrew Peng、Ian Kivlichan、Mehmet Yatbaz、Madelaine Boyd、Anna-Luisa Brakman、Florencia Leoni Aleman、Henry Head、Molly Lin、Meghan Shah、Chelsea Carlson、Sam Toizer、Ryan Greene、Alison Harmon、Denny Jin、Karolis Kosas、Marie Inuzuka、Peter Bakkum、Barret Zoph、Luke Metz、Jiayi Weng、Randall Lin、Yash Patil、Mianna Chen、Andrew Kondrich、Brydon Eastman、Liam Fedus、John Schulman、Vlad Fomenko、Andrej Karpathy、Aidan Clark、Owen Campbell-Moore