メインコンテンツにスキップ

2024年9月12日

OpenAI o1-previewが登場

難解な問題を解決する推論モデルの新シリーズ。遂に登場。

2024年9月17日更新情報:o1-previewのレート制限が週50クエリ、o1-miniのレート制限が1日50クエリになりました。

当社は、回答を生成する前により多くの時間をかけて思考するように設計されたAIモデルの新シリーズを開発しました。新モデルは、科学、コード生成、数学の分野で、前身モデルよりも複雑なタスクを通して推論し、難解な問題を解決できます。

ChatGPTと当社のAPIでは、このシリーズの最初のモデルが現在公開されています。これはプレビューで、定期的なアップデートと改良を提供予定です。この新モデルの公開と共に、現在開発中の次のアップデート向けの評価も含めています。

仕組み

当社は、人間が何かを問われた時にそうするように、問題に対する回答を生成する前に問題についてより長い時間をかけて考えるよう、新モデルを訓練しました。訓練を通してモデルは、思考プロセスを改善し、さまざまな戦略を試し、自らの誤りを認識することを学習しています。 

自社試験において、次のモデルのアップデートは、物理、科学、生物の分野でベンチマークタスクに挑戦する博士課程の学生と類似のパフォーマンスを発揮しています。さらに、数学とコード生成においても優れた能力を発揮していることが認められました。国際数学オリンピック(IMO)の予選試験において、GPT-4oが正解したのは問題のわずか13%でしたが、推論モデルは83%のスコアを達成しました。この推論モデルのコード生成能力は、各種コンテストで評価され、Codeforcesのコンテストでは、89パーセンタイルを達成しました。詳細については、当社の技術研究に関する投稿をご覧ください。

初期モデル同様、情報を入手することを目的としたウェブブラウジングやファイルと画像のアップロードなど、ChatGPTを有用なものにする機能はまだそこまでたくさん搭載されていません。多くの一般的なケースにおいて、GPT-4oは近い将来、今以上に有能なものとなる予定です。

ただし複雑な推論タスクに関してこれは大きな進歩であり、AIの新たなレベルの能力を示すものです。以上を踏まえ、当社はカウンターを1にリセットし、このシリーズを「OpenAI o1」と名付けました。

安全性

新モデルの開発の一環として、当社は安全に関する新しい訓練アプローチを考案しました。このアプローチは、AIのセーフティとアライメントに関するガイドラインにモデルを従わせるための推論能力を活用します。置かれた状況の中で当社の安全性に関するルールについて推論できることで、新モデルはルールをこれまでよりも効果的に適用できます。 

当社が安全性を評価するために用いているひとつの方法に、ユーザーがルールを回避(「ジェイルブレイク」として知られる行為)しようと試みた場合、当社のモデルがどの程度安全性に関するルールに従い続けるかをテストする方法があります。当社の最も厳しいジェイルブレイクテストのひとつにおいて、GPT-4oのスコアが22(0~100のスコア中)であった一方で、o1-previewモデルのスコアは84でした。詳細は、System Cardと当社の研究に関する投稿でご確認いただけます。

新モデルの新しい能力と一致させるため、当社は安全性に関する取り組み、社内のガバナンス、連邦政府との連携を強化しました。これには、当社のPreparedness Framework(新しいウィンドウで開く)を用いた厳しいテストと評価、クラス最高のレッドチーム、取締役会レベルでの審査プロセス(当社の安全&セキュリティ委員会による審査プロセスなど)が含まれます。

AIセーフティに関する当社の取り組みを前進させるため、当社は先日アメリカおよびイギリスのAIセーフティ・インスティテュートと正式な合意を締結しました。当社は、同インスティテュートにこのモデルの研究版への先行アクセスを付与するなど、合意の運用を開始しました。これは、当社のパートナーシップにおける重要な第一歩であり、一般公開前および一般公開後に、将来のモデルの研究、評価、テストを実施するプロセスの確立に役立ちます。

メリットが得られるユーザー

科学やコード生成、数学や類似の分野において複雑な問題に取り組んでいる場合には特に、この強化された推論能力が役立つことでしょう。たとえば、医療業界の研究者は細胞のシーケンシングに関するデータに注釈を付けるために、物理学者は量子光学に必要となる複雑な数式を生成するために、分野を問わず開発者は複数の工程で構成されるワークフローを構築し実行するためにo1を使用できます。 

OpenAI o1-mini

o1シリーズは、複雑なコードを高精度で生成・デバッグする能力に優れています。開発者にさらに効率的なソリューションを提供するため、当社は特にコード生成で能力を発揮するさらに高速でリーズナブルな推論モデル「OpenAI o1-mini」も公開しています。小規模モデルであるo1-miniは、o1-previewよりも80%安価なモデルで、推論が必要である一方で広範にわたる世界の知識を必要としない用途向けの高性能かつコスト効率の良いモデルとなります。 

OpenAI o1の使い方

ChatGPTのPlusおよびTeamのユーザーの方は、本日よりChatGPTでo1モデルを使用できます。o1-previewとo1-miniはいずれもモデル選択で手動選択でき、リリース時はメッセージのレート制限が1週間あたりo1-previewでは30件、o1-miniでは50件となる予定です。現在このレートを増やし、入力されたプロンプトに適切なモデルをChatGPTが自動選択できるように取り組みを進めています。

An image of the new ChatGPT dropdown that displays the new "o1-preview" model option over a bright yellow and blue abstract background

ChatGPT EnterpriseおよびEduのユーザーの方には、来週初めに両モデルへのアクセス権が付与されます。 

API usage tier 5(新しいウィンドウで開く)の条件を満たす開発者の方は、本日よりAPIで両方のモデルを使用してプロトタイピングを始めることができます。レート制限は、20 RPMとなります。追加のテストを終了後、この制限を増やすための取り組みを進めています。現時点で新モデルのAPIには関数の呼び出し、ストリーミング、システムメッセージのサポート、その他の機能は含まれていません。使用を開始する場合は、APIドキュメント(新しいウィンドウで開く)をご確認ください。

また、ChatGPT無料ユーザーの方にもo1-miniをご利用いただけるようにする予定です。 

今後の展望

これはChatGPTおよびAPIでご利用いただける推論モデルの初期段階のプレビューです。モデルのアップデートに加え、すべてのユーザーにとって有用なモデルに改善するため、当社はブラウジング、ファイルと画像のアップロード、その他の機能を追加する予定です。 

また、新しいOpenAI o1シリーズに加え、当社のGPTシリーズのモデルの開発と公開を今後も続けていく予定です。 

著者

OpenAI