メインコンテンツにスキップ
OpenAI

2024年1月25日

製品

新しい埋め込みモデルと API の更新

新世代の埋め込みモデル、新しい GPT‑4 Turbo とモデレーションモデル、新しい API 使用管理ツールを公開し、後に GPT‑3.5 Turbo を値下げします。

新しい埋め込みモデルと API の更新
読み込んでいます...

新しいモデルをリリースし、GPT‑3.5 Turbo を値下げするほか、開発者が API キーを管理し、API の使用状況を把握するための新しい方法を発表します。新モデルの内容はこちらです。

  • 2つの新しい埋め込みモデル
  • GPT‑4 Turbo の更新版プレビューモデル 
  • GPT‑3.5 Turbo の更新版モデル
  • 更新版テキストモデレーションモデル

デフォルトでは、OpenAI API に送信されるデータは、OpenAI モデルの学習や改良には使用されません。

料金を抑えた新しい埋め込みモデル

2つの新しい埋め込みモデルを発表します。小さく高効率な text-embedding-3-small モデルと、大きく強力な text-embedding-3-large モデルです。

埋め込みとは、自然言語やコードなどのコンテンツ内で概念を表す数列のことです。埋め込みは、機械学習モデルなどのアルゴリズムがコンテンツ間の関係を理解し、クラスタリングや検索などのタスクを実行することを容易にします。ChatGPT と Assistants API、多くの検索拡張生成(RAG)開発者ツールの知識検索といったアプリケーションを駆動しています。

読み込み中...

新しい小型テキスト埋め込みモデル

text-embedding-3-small は、当社の新しい高効率な埋め込みモデルであり、2022年12月にリリースされた前身の text-embedding-ada-002 モデルから大幅なアップグレードを提供します。 

より高性能。text-embedding-ada-002text-embedding-3-small を比較すると、多言語検索でよく用いられるベンチマーク(MIRACL(新しいウィンドウで開く))の平均スコアは31.4%から44.0%に向上し、英語タスクでよく用いられるベンチマーク(MTEB(新しいウィンドウで開く))の平均スコアは61.0%から62.3%に向上しています。

低料金化。text-embedding-3-small は、前世代の text-embedding-ada-002 モデルよりも大幅に効率化しています。そのため、text-embedding-3-small の料金は、text-embedding-ada-002 と比べて1/5となり、1000トークンあたり0.0001ドルから0.00002ドルになりました。

text-embedding-ada-002 は廃止予定ではないため、新しいモデルを推奨しますが、前世代のモデルを引き続き利用することもできます。

新しい大型テキスト埋め込みモデル:text-embedding-3-large

text-embedding-3-large は、新しい次世代の大型埋め込みモデルで、最大3072ディメンションの埋め込みを作成します。

性能強化。text-embedding-3-large は、新しいベストパフォーマンスモデルです。text-embedding-ada-002text-embedding-3-large を比較すると、MIRACL では平均スコアが31.4%から54.9%に、MTEB では平均スコアが61.0%から64.6%に向上しています。

評価ベンチマーク

ada v2

text-embedding-3-small

text-embedding-3-large

MIRACL 平均

31.4

44.0

54.9

MTEB 平均

61.0

62.3

64.6

text-embedding-3-large の料金は1000トークンあたり$0.00013となります。

新しい埋め込みモデルの使い方について詳しくは、埋め込みガイド(新しいウィンドウで開く)をご覧ください。

埋め込み短縮のネイティブサポート

ベクターストアに保存して検索する場合など、より大きな埋め込みを使用する場合は、一般的に、小型の埋め込みを使用するよりもコストがかかり、より多くの計算、メモリ、ストレージを消費します。

当社の新しい埋め込みモデルは、いずれも開発者が埋め込みを使用する際の性能とコストを釣り合わせられるようにする手法Aで学習を行っています。具体的には、dimensions API パラメーターを渡すことで、埋め込みがその概念を表す特性を失うことなく埋め込みを短縮できます(シーケンスの末尾からいくつかの数字を削除)。例えば、MTEB ベンチマークでは、text-embedding-3-large 埋め込みを256サイズに短縮しても、1536サイズの短縮されていない text-embedding-ada-002 埋め込みの性能を上回ることができます。

読み込み中...

これで非常に柔軟な使い方が可能になります。例えば、1024ディメンションまでの埋め込みしかサポートしていないベクターデータストアを使用する場合、開発者は最適な埋め込みモデル text-embedding-3-large を使用し、dimensions API パラメーターに1024を指定することで、埋め込みを3072ディメンションから短縮し、精度と引き換えにベクターサイズを小型化できます。

他の新モデルと値下げ

GPT-3.5 Turbo 更新版モデルと値下げ

来週、GPT‑3.5 Turbo の新モデルである gpt-3.5-turbo-0125 を発表します。また、過去1年間で3度目となる GPT‑3.5 Turbo の値下げを行い、お客様の規模拡大を支援します。新モデルの入力料金は50%引き下げられて1000トークンあたり0.0005ドルに、出力料金は25%引き下げられて1000トークンあたり0.0015ドルになります。このモデルには、要求されたフォーマットでの応答精度の向上や、英語以外の言語の関数呼び出しでテキストエンコーディングの問題を起こしていたバグ(新しいウィンドウで開く)修正など、さまざまな改良を行います。

固定されていない gpt-3.5-turbo モデルエイリアスを使用しているお客様は、このモデルの開始から2週間後に gpt-3.5-turbo-0613 から gpt-3.5-turbo-0125 に自動的にアップグレードされます。

更新版 GPT-4 Turbo プレビュー

リリース以来、GPT‑4 API のお客様からの要求のうち70%以上が GPT‑4 Turbo に移行しています。開発者が更新されたナレッジカットオフ、より大きな128kのコンテキストウィンドウ、低料金を利用できることが要因です。 

本日、GPT‑4 Turbo プレビューモデルの更新版である gpt-4-0125-preview をリリースします。このモデルは、以前のプレビューモデルよりもコード生成などのタスクをより徹底的に実行し、モデルがタスクを完了しない「怠慢」のケースを減らすことを意図しています。新モデルには、英語以外の UTF-8 世代に影響するバグの修正も含まれています。

GPT‑4 Turbo プレビューの新バージョンに自動的にアップグレードされたい方のために、新しい gpt-4-turbo-preview モデル名のエイリアスを導入し、これが常に最新の GPT‑4 Turbo プレビューモデルを指すようにしました。 

GPT‑4 Turbo は、今後の数か月間で一般公開する予定です。

更新版モデレーションモデル

無料の Moderation API により、開発者は有害な可能性のあるテキストを特定できます。継続的な安全対策の一環として、これまでで最も堅牢なモデレーションモデルである text-moderation-007 をリリースします。text-moderation-latest および text-moderation-stable エイリアスがこれを指すように更新されました。安全な AI システムの構築について詳しくは、安全性ベストプラクティスガイド(新しいウィンドウで開く)をご覧ください。

API の使用状況を把握し、API キーを管理する新しい方法

開発者が API キーの使用状況をより把握し、管理できるようにするため、2つのプラットフォームの改良を実施します。

まず、開発者は API キーのページ(新しいウィンドウで開く)から API キーに権限を割り当てることができるようになりました。例えば、内部追跡ダッシュボードを実行するためにキーに読み取り専用アクセスを割り当てたり、特定のエンドポイントにのみアクセスできるよう制限したりできます。

次に、使用状況ダッシュボードと使用状況のエクスポート機能は、トラッキングをオン(新しいウィンドウで開く)にした後、API キーレベルで指標を表示するようになりました。このため、機能、チームごと、プロダクト、プロジェクトごとに別々の API キーを用意するだけで、簡単に使用状況を見ることができます。

画像2

今後数か月間に、特に大規模な組織において開発者が API の使用状況を確認したり API キーを管理したりする機能をさらに改良する予定です。

OpenAI の API の最新情報については、X で @OpenAIDevs(新しいウィンドウで開く) をフォローしてください。

著者

OpenAI

謝辞

Juntang Zhuang、Paul Baltescu、Joy Jiao、Arvind Neelakantan、Andrew Braunstein、Jeff Harris、Logan Kilpatrick、Leher Pathak、Enoch Cheung、Ted Sanders、Yutian Liu、Anushree Agrawal、Andrew Peng、Ian Kivlichan、Mehmet Yatbaz、Madelaine Boyd、Anna-Luisa Brakman、Florencia Leoni Aleman、Henry Head、Molly Lin、Meghan Shah、Chelsea Carlson、Sam Toizer、Ryan Greene、Alison Harmon、Denny Jin、Karolis Kosas、Marie Inuzuka、Peter Bakkum、Barret Zoph、Luke Metz、Jiayi Weng、Randall Lin、Yash Patil、Mianna Chen、Andrew Kondrich、Brydon Eastman、Liam Fedus、John Schulman、Vlad Fomenko、Andrej Karpathy、Aidan Clark、Owen Campbell-Moore